작성한 질문수
[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
해결된 질문
작성
·
127
0
안녕하세요 강사님!
2유형에서 걱정되는 부분이 있어서 질문드립니다!
2유형 train_test_split 으로 검증 할 때, test_size 값 범위를 최대 몇 프로까지 제한하는게 좋을까요?
랜덤포레스트 기준 하이퍼 파라미터 값들의 권장하는 최대 범위를 알고 싶습니다.
(max_depth, n_estimators)
어느정도 범위까지가 괜찮을지 감이 잘 안오네요 ㅠ
과적합을 고려했을 때 권장하는 범위가 있을까요?
오늘도 질문 읽어주셔서 감사합니다!
답변 1
데이터에 따라 다릅니다. 빅분기 데이터가 작은 데이터여서 조심스럽지만 0.2로 하시죠!
일반화하기 참 어려운 질문이네요.
일반적인 데이터로 제 경험으로 말씀드리면
분류 : max_depth 3~5
회귀 : max_depth 7~12
공통 : n_estimators : 200~500