인프런 커뮤니티 질문&답변

정재욱 새벽하늘님의 프로필 이미지
정재욱 새벽하늘

작성한 질문수

[개정판] 파이썬 머신러닝 완벽 가이드

교차검증 성능평가 cross_val_score()와 하이퍼 파라미터 튜닝을 위한 GridSearchCV - 01

GridSearchCV에 대한 질문

작성

·

209

0

안녕하세요, GridSearchCV에 대해 질문 드립니다.

줄여서 Grid라 쓰겠습니다

뭔가 정리가 안되서요,,,ㅎ

1. Grid는 교차 검증과 최적 하이퍼 파라미터 튜닝을 한 번에 해주는데요, 교차 검증 시 Straitified K 폴드 방식으로 하는지 K 폴드 방식으로 하는지 어떻게 알 수 있나요? 혹시 어떻게 폴딩 했는지 볼 수 있는 속성이 있나요? ( ex. best_estimator_와 같은 함수같은..)

2. 책 p109에서 교차 검증시 학습/검증 레이블 데이터 분포를 확인 할 수 있었는데요, Grid에서도 동일하게 확인 할 수 있는 방법이 있나요?

grid가 Stratified K Fold를 포함하고 있는지.. 헷갈립니다ㅠ

답변 4

0

그쵸? 넵 확인 해주셔서 감사드립니다.

또 열심히 공부하겠습니다!!

0

권 철민님의 프로필 이미지
권 철민
지식공유자

오픈된 메뉴얼 상에서는 레이블 데이터 분포를 확인 할 수 있는 API나 attribute를 찾지 못했습니다. 

감사합니다.

0

빠른 답변 감사합니다.!!

사이킷런 메뉴얼?에서 자세하게 설명해 놨군요 자주 참고해야 겠습니다!

2번 질문인 레이블 데이터 분포를 확인 할 수 있는 방법은 없는거죠..?

0

권 철민님의 프로필 이미지
권 철민
지식공유자

안녕하십니까,

GridSearchCV는 기본적으로 분류(Classification)일 경우 Stratified K 방식입니다. 회귀에서는 Stratified K 를 쓸수 없기에 K Fold입니다.

해당 내역은 https://scikit-learn.org/stable/modules/generated/sklearn.model_selection.GridSearchCV.html

에서 cv parameter 설명에서 확인하실 수 있습니다.

감사합니다.

정재욱 새벽하늘님의 프로필 이미지
정재욱 새벽하늘

작성한 질문수

질문하기