작성
·
292
1
1. grid가 교차검증과 하이퍼파라미터 튜닝을 동시에 해주는 것이면 cross val score를 또 수행할 필요는 없는것인가요? 또 수행하면 교차검증을 2번하는것으로 이해가 됩니다...
2. 사이킷런 train test split을 적용한 뒤에 또 cross나 grid를 수행하면 데이터를 3가지로 다시 나누는 것인가요? 이런 경우라면 굳이 split을 사용하지 않고 cross나 grid로 처음부터 데이터를 나누면 되지 않나...그런 혼돈이 옵니다...
답변 2
0
2. 캐글 문제를 풀다보니 제 스스로 저런 생각이 들었습니다.
개별 api 용도에 있어서 개념이 잘 안잡혀서 생긴 궁금증 같습니다. 다시 짚어주신 덕에 이해했습니다.^^
0
1. 네 맞습니다. 또 수행할 필요 없습니다.
2. 동영상 강의의 어느 시간에서 그런 내용이 있는지 말씀해 주시면 좋을 것 같습니다.
개별 API는 각각의 용도가 있습니다.
train_test_split()는 간편하게 전체 데이터를 학습/테스트(또는 검증)용 데이터 세트로 분리하는 데 사용됩니다.
cross_val_score()는 간편하게 교차검증 결과 평가 지표(정확도, 정밀도등)를 반환해 줍니다.
GridSearchCV는 교차 검증을 통해 최적 하이퍼 파라미터를 찾아주는 역할을 합니다.
개별 용도에 맞게 각각을 사용하시면 됩니다.