작성한 질문수
[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
예시문제 작업형2(신 버전)
해결된 질문
작성
·
218
0
안녕하세요! 다름이 아니라, 예시문제 작업형2(신버전) 강의를 보다가 , unique() 사용해서 Data중에 '소형가전'이 Train, Test가 다르다는 걸 알려주셨는데. 이후에 별 조치가 없는거같아서 혹시 이런 경우에는 별도의 전처리를 진행하나요? 아니면 그냥 동일하게 LabelEncoding만 하는거인지 궁금합니다!!
답변 1
## train과 test 특정 범주형 컬럼의 카테고리가 같을 때
- 원핫 or 레이블 둘 다 상관없음
## train과 test 특정 범주형 컬럼의 카테고리가 다를 때
- train이 test를 포함한다면: 레이블 인코딩, 사이킷런 원핫인코딩, train+test 합쳐서 인코딩
- test가 train을 포함한다면: train+test 합쳐서 인코딩