인프런 커뮤니티 질문&답변

jms717958님의 프로필 이미지

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

모델링 및 평가(분류)

인코딩과 컬럼선택기준

해결된 질문

23.11.20 15:49 작성

·

269

0

  • 인코딩을 할때 선생님이 어쩔때는 원핫인코딩을 하시고 어쩔때는 레이블인코딩을 하시던데 그 인코딩을 정하시는 기준을 잘 모르겠습니다! 인코딩을 정하실때 그 경우에 대해서 자세히 알려주시면 감사하겠습니다 그리고 인코딩을 할때 컬럼도 몇개 정하셔서 하시던데 그 컬럼고르는 기준도 잘 모르겠습니다 그 기준에 대해서도 선택하는 방법을 알려주시면 감사하겠습니다 ㅠㅠ

답변 1

0

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

2023. 11. 20. 20:25

데이터를 전처리 할때 문자-> 숫자로 변경하는 인코딩은 범주형 데이터가 있다면 반드시 처리 해줘야 합니다.

train.info()를 통해 자료형을 확인한 후 object자료형은 인코딩이 필요합니다.

object자료형 컬럼을 선택해서 원핫 또는 레이블인코딩 중에 선택해서 진행하면 됩니다.

 

어떤 것을 선택하던 사용하기 편한 것을 선택해 주세요!! (저는 카테고리(종류)가 대략 10개가 넘어가면 레이블 인코딩을 쓰고 있습니다)

아직 앞쪽 강의를 보고 있어서 어색할 수도 있습니다. 인코딩은 반복해서 뒤에서도 계속 사용하니 익혀주시길 바라겠습니다.