작성한 질문수
[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
기출(작업형2) 한 가지 방법으로 풀기
해결된 질문
작성
·
126
0
검증 데이터 분할을 해서 일반적으로
모델에 rf.fit(X_tr_y_tr)을 진행하고 예측하다가
마지막에 바로 pred =rf.predict(test)로 테스트 데이터를 집어 넣는데요,
rf.fit(train,target) 으로 다시 학습하고 집어 넣지 않아도 상관이 없나요 ?
두개가 굳이 차이가 없기떄문에 분할로 생성된 모델을 넣는건지 이유가 있는건지 궁금합니다
답변 1
rf.fit(X_tr_y_tr) vs rf.fit(train,target)
둘 다 좋습니다.
다만 하이퍼파라미터 튜닝을 했다면 rf.fit(X_tr_y_tr) 에 최적화 될테니 그대로 진행해주시고
튜닝이 없다면 rf.fit(train,target)도 좋아요!
튜닝도 하고 싶고, rf.fit(train,target)도 하고 싶다면
검증데이터 분할 방식을 크로스 밸리데이션으로 가져가는 방법이 있습니다. 좀 더 복잡해져요!
답변 감사합니다!
답변 감사합니다!