작성한 질문수
[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
해결된 질문
작성
·
332
0
여러 가지 분석 모델이 존재하는데
(대표적으로 랜덤포레스트 그 외에도 xgboost, 디시젼트리, 로비스틱 회귀 등)
경우에 따라 다르겠지만 랜덤포레스트만 사용해도 될까요?(하이퍼파라미터 튜닝은 한다는 가정하에)
물론 여러 방법 해보면 정확도 높은 걸로 할 수 있어서 좋겠지만, 외우는게 부담인 것 같아서요
그리고 전처리 후에 라벨인코딩 vs 원핫인코딩 등 여러 방법이 있는데
어떤 상황에선 뭐로 하는게 좋다 이런 공식은 따로 없는 것일까요?
답변 1
네 딱 하나만 준비한다면 랜덤포레스트 추천하고, 두번짼 lightgbm 추천해요!
공식은 없습니다. 검증데이터를 가지고 평가한 후 결과 값을 보고 어떤 인코딩을 선택할지 결정합니다.
고성능을 요구하는 것은 아니니 이것도 하나로 밀고, 백업을 준비하는 걸로 하시는게 어떨까요?