인프런 커뮤니티 질문&답변

gkgktmd님의 프로필 이미지

작성한 질문수

[개정판] 파이썬 머신러닝 완벽 가이드

LightGBM을 이용한 위스콘신 유방암 예측

lgith gbm의 장점 질문

해결된 질문

20.07.05 14:54 작성

·

338

1

lgbm의 장점중 카테고리형 피처의 자동 변환과 최적 분할(원 핫인코딩을 사용하지 않고도-)

라고 되어있는부분이 있습니다.

앞서 레이블 인코딩에 비해 원핫인코딩의 장점을 설명해주셨는데 만약 lgbm을 사용할 시에는

카테고리 피쳐를 굳이 원핫인코딩이 아닌 레이블 인코딩으로 변환하여 1칼럼으로 써도 크게 상관없다는 의미 일까요?

답변 2

0

gkgktmd님의 프로필 이미지
gkgktmd
질문자

2020. 07. 06. 09:20

그렇군요 감사합니다!

0

권 철민님의 프로필 이미지
권 철민
지식공유자

2020. 07. 05. 20:54

안녕하십니까,

lgbm 뿐만 아니라 트리기반의 Ensemble경우 일반적으로 원핫 인코딩이 큰 성능향상은 없어보입니다.

원핫 인코딩이 좋을지 아닐지는 모델을 직접 구동해봐야 알지만, Decision Tree가 트리 분할이기 때문에 Label Encoding의 Label값의 크기에 영향이 크지 않기 때문에 그런것 같습니다.

감사합니다.

gkgktmd님의 프로필 이미지

작성한 질문수

질문하기