인프런 커뮤니티 질문&답변

hj2930hj님의 프로필 이미지
hj2930hj

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

유니크 값이 다를때

해결된 질문

작성

·

132

0

유니크 값이 다를때는 라벨인코딩을 사용하면 상관없는건가요?

답변 2

2

데이터를 합친 다음 인코딩을 하시고 다시 분할 하셔야 합니다.

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

답변 감사합니다 🙂

 

1

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

train이 test를 카테고리를 포함하면 라벨인코딩이 맞습니다.

그외 경우라면 합쳐서 인코딩이 필요합니다.

hj2930hj님의 프로필 이미지
hj2930hj
질문자

train의 unique 수가 더 많은 경우에는 그냥 라벨 인코딩을 해줘도 상관없고(train이 test 카테고리를 모두 포함한경우)

test의 unique수가 더많으면 데이터를 합치고 인코딩해주고 분할해주는 거 맞나요?

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

네!! 맞습니다.

hj2930hj님의 프로필 이미지
hj2930hj

작성한 질문수

질문하기