작성
·
120
0
안녕하세요
강의를 복습하던 중 교차검증과 관련하여 궁굼한게 생겨 문의남깁니다.
교차검증을 통한 예측값을 산출할 때 cross_val_predict 메소드를 사용 하는 것으로 이해했습니다. 그래서 아래와 같이 코드를 만들었을 때 잘 동작했고요.
y_cross_val_predict= cross_val_predict(model, X_train, y_train, cv=10, n_jobs=60)
근데 혹시 Test데이터에서도 가능한가 해서 데이터를 바꿔서
y_cross_val_predict= cross_val_predict(model, X_test, y_test, cv=10, n_jobs=60)
를 수행하니 코드는 문제없이 작동했는데 이 부분이 Test 데이터 셋에서 10개의 폴드로 나눠 교차검증을 한것으로 이해했는데 맞을까요?
답변 1
0
안녕하십니까,
저는 거의 cross_val_predict()를 사용하지는 않지만(저도 사이킷런 처음 배울때 함 써본 기억이 있는것 같습니다 ^^;;)
말씀하신대로 Test 데이터로 적용해도 별 문제는 없습니다. 다만 강의에서도 말씀드리듯이 보통은, 학습, 검증, 테스트 용으로 데이터 세트를 분할하여 사용하는 것이 일반적이므로 굳이 cross validation에 테스트 데이터를 사용할 필요는 없어 보입니다.
감사합니다.