인프런 커뮤니티 질문&답변

유재석님의 프로필 이미지
유재석

작성한 질문수

[개정판] 파이썬 머신러닝 완벽 가이드

하이퍼 파라미터에 관해서 질문합니다.

작성

·

151

0

.하이퍼 파라미터란 머신러닝의 모델의 성능을 높여주기 위해 사용자가 임의로 파라미터 값을 지정하는 걸로 알고 있습니다.

타이타닉 생존자 예측 실습 코드에 보면 GreadSearchCV에 넣어줄 파라미터를 max_depth=[2,3,5,10], min_sample_splits[2,3,5], min_samples_leaf[1,5,8] 를 변경하면서 최적의 파라미터를 찾는데 

하이퍼 파라미터의 값을 튜닝할 때 max_depth, min_sample_splits, min_sample_leaf 이 3가지 key 값에 대해서 궁금합니다. 또한 max_depth, min_sample_splits, min_samlpe_leaf 이렇게 3가지로 하이퍼 파리미터를 튜닝했는지가 궁금합니다. 

답변 1

1

권 철민님의 프로필 이미지
권 철민
지식공유자

안녕하십니까,

타이타닉은 개괄적인 머신러닝방식을 설명드리기 위함이며 개별 하이퍼 파라미터에 대한 설명은 4장 분류에서 자세히 말씀드립니다.

먼저 decision tree의 max_depth, min_sample_splits, min_sample_leaf 에 대해서 간략히 말씀드리면 max_depth는 tree를 생성할 때 최대 깊이, min_samples_splits는 tree에서 노드들을 분할(split)하기 위한 최소 데이터 수, min_sample_leaf는 tree의 leaf 노드가 되기 위한 최소 데이터 수를 의미합니다.  그리고 이 3개 하이퍼 파라미터가 decision tree의 주요 하이퍼 파라미터입니다.

4장 결정트리(decision tree) 부분에 보다 상세한 설명이 되어있으니 해당 부분을 참조하시면 도움이 되실 듯 합니다.

유재석님의 프로필 이미지
유재석

작성한 질문수

질문하기