인프런 커뮤니티 질문&답변

Dongjin Park님의 프로필 이미지

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

예시문제 작업형2(신 버전) 🆕 updated 2023.11

예시문제 작업형2(신버전) EDA 소형가전

해결된 질문

23.11.24 09:45 작성

·

201

0

안녕하세요! 다름이 아니라, 예시문제 작업형2(신버전) 강의를 보다가 , unique() 사용해서 Data중에 '소형가전'이 Train, Test가 다르다는 걸 알려주셨는데. 이후에 별 조치가 없는거같아서 혹시 이런 경우에는 별도의 전처리를 진행하나요? 아니면 그냥 동일하게 LabelEncoding만 하는거인지 궁금합니다!!

답변 1

0

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

2023. 11. 25. 06:23

## train과 test 특정 범주형 컬럼의 카테고리가 같을 때

- 원핫 or 레이블 둘 다 상관없음

## train과 test 특정 범주형 컬럼의 카테고리가 다를 때

- train이 test를 포함한다면: 레이블 인코딩, 사이킷런 원핫인코딩, train+test 합쳐서 인코딩

- test가 train을 포함한다면: train+test 합쳐서 인코딩