인프런 커뮤니티 질문&답변

김예지님의 프로필 이미지
김예지

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

2회 기출유형(작업형2)

2회 기출유형(작업형2)

해결된 질문

작성

·

47

0

  • 2회 기출유형(작업형2)에서 랜덤포레스트나 XGB에서 하이퍼파라미터 (max_depth)같은거 지정해서 성능 높여도되는걸까요?

답변 2

0

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

네!! 너무 좋습니다.

다만 max_depth 감이 있다면 추천하지만

입문자라면 하이퍼파라미터 튜닝은 추천하지 않아요! 오히려 성능을 떨어뜨릴 수 있습니다.

 

데이터에 따라 달라 일반적으로 적용할 순 없지만 경험적으로 말씀드리면

분류 max_depth: 3~7 정도

회귀 max_depth 7~12정도

가 적당했습니다.

0

안녕하세요, 인프런 AI 인턴입니다. 김예지님께서 질문해주신 하이퍼파라미터 조정에 대한 내용을 바탕으로 유사한 기존 질문과 답변을 확인해보았습니다.

  1. XGBoost와 랜덤포레스트의 max_depth 튜닝이 실제 성능에 미치는 영향에 대한 질문: 해당 질문에서는 하이퍼파라미터인 max_depth의 효과와 랜덤 상태에 따른 모델 성능 차이에 대한 궁금증을 해결할 수 있습니다. 기본적으로 하이퍼파라미터 튜닝은 모델 성능을 최적화하기 위한 중요한 과정이며, 튜닝을 통해 모델의 복잡성을 조절하여 과적합을 방지하거나 성능을 향상시킬 수 있습니다. 하지만 시험 환경에서의 시간적 제약을 고려하여, 심플한 튜닝을 통해 비교적 높은 정확도를 얻을 수 있는 모델을 제출하는 것이 좋습니다.

  2. 랜덤포레스트와 XGBoost의 하이퍼파라미터 설정에 따른 모델 성능 차이: 하이퍼파라미터 조정은 모델 성능 향상에 기여할 수 있으며, 특히 max_depth와 같은 파라미터는 모델의 복잡도를 크게 좌우하여 테스트 데이터에 대한 성능의 차이를 유발할 수 있습니다. 주어진 테스트에 대해 검증 데이터를 활용하여 최적의 하이퍼파라미터를 찾는 것이 중요하며, 보통은 검증 집합에서의 성능이 실제 테스트 집합에서도 유사하게 나타나는 경우가 많습니다.

기타 랜덤포레스트를 사용하는 질문도 하이퍼파라미터 튜닝이 성능 개선에 도움이 되는지에 대한 논의를 포함하고 있습니다.

이와 같은 방식으로 하이퍼파라미터를 설정하셔서 실전에 임하시면 좋은 결과를 얻으실 확률이 높아질 것으로 예상됩니다.

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다. 현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏 추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

김예지님의 프로필 이미지
김예지

작성한 질문수

질문하기