인프런 커뮤니티 질문&답변

joy10780님의 프로필 이미지

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

4회 기출 유형(작업형2)

인코딩

해결된 질문

작성

·

109

0

  • 학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!

  • 질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요

  • 먼저 유사한 질문이 있었는지 검색해보세요

범주형 데이터가 있으면 필수로 인코딩을 해줘야하는걸로 알고 있는데요

이때 무조건 라벨인코딩으로 진행하려고 하는데 문제없는 사항인가요?

답변 2

1

LabelEncoder을 사용하면 왠만한 문제는 해결됩니다만 무조건은 아닙니다.

 

다양한 인코더를 참고해보세요

원핫 인코더, 이진 인코더 등

0

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

데이터가 어떤 형태인지 알 수 없어 무조건이란 말은 위험합니다.

왠만하면 라벨 인코딩시 처리 될 것으로 보입니다.

joy10780님의 프로필 이미지
joy10780
질문자

아하! 넵넵

그렇다면 언제 라벨인코딩을 하며 언제 원핫인코딩을 하는 것일까요?

무엇을 보고 판단하여야할지요...

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

가장 좋은 것은 둘다 해보고

검증데이터로 평가해보고 성능이 좋은 것을 선택하면됩니다.

또는 범주형 컬럼이 많고, 또한 카테고리가 너무 많으면(10개이상?) 라벨인코딩하는 것을 추천해요~~

joy10780님의 프로필 이미지

작성한 질문수

질문하기