해결된 질문
23.11.30 23:18 작성
·
123
0
피쳐엔지니어링에서
가장 베이직한 방법이
범주형 데이터 - > 인코딩 진행 후 평가 하는 방법이 맞을까요
모델을 학습하는 여러가지 방법을 정리해보려고 하는데 맞는지 확인부탁드립니다 ㅠ ㅠ
데이터 : 범주형+수치형 데이터
범주형 인코딩 -> 모델학습 (범주형만 학습 )-> 평가
범주형 인코딩 -> 모델학습 (범주형+수치형 학습) - > 평가
수치형 스케일링 -> 모델학습 (수치형 )-> 평가
범주형 인코딩 + 수치형 스케일링 -> 모델학습 (범주형+수치형 학습)-> 평가
보통 1이랑 2중에 2을 일반적으로 많이 사용하나요?
그리고 다른 모델은 테스트 안해보고 랜덤포레스트만 사용하고 제출하게 되면 점수에 영향이 많이 미칠까요..?
보통 어떤 모델 사용하면 좋을지 추천 부탁드립니다 ㅠㅠ
답변 1
0
2023. 12. 01. 04:58
2번과 4번을 사용하면 좋습니다. 1번과 3번은 문제가 있을 것 같아요!
랜덤포레스트와 lightgbm 추천드립니다.
시험 잘 보고 오세요 🙂