작성한 질문수
[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
해결된 질문
작성
·
148
0
유니크 값이 다를때는 라벨인코딩을 사용하면 상관없는건가요?
답변 2
2
데이터를 합친 다음 인코딩을 하시고 다시 분할 하셔야 합니다.
답변 감사합니다 🙂
1
train이 test를 카테고리를 포함하면 라벨인코딩이 맞습니다.
그외 경우라면 합쳐서 인코딩이 필요합니다.
train의 unique 수가 더 많은 경우에는 그냥 라벨 인코딩을 해줘도 상관없고(train이 test 카테고리를 모두 포함한경우)
test의 unique수가 더많으면 데이터를 합치고 인코딩해주고 분할해주는 거 맞나요?
네!! 맞습니다.
답변 감사합니다 🙂