인프런 커뮤니티 질문&답변

dlwjddn0905님의 프로필 이미지
dlwjddn0905

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

작업형 2번 model.fit 적용 문의

해결된 질문

작성

·

462

0

안녕하세요!!

작업형 2번 공부하다가 문득 궁금증이 생겨 문의드립니다.

model_selection의 train_test_split 이후 (X_train, y_train => X_tr, X_val, y_tr, y_val)

RF, Lightgbm, Xgboost 등 여러 모델 테스트 후, 가장 성능 좋은 모델을 선정하여

pred= model.predict(X_test)

이렇게 결과물을 도출하는 과정에서요.

 

검증단계에서 model.fit(X_tr, y_tr) 이렇게 학습을 진행한 것을 바로 X_test에 predict를 하는데

검증자료로 분할한 X_tr, y_tr이 아닌, 전체 X_train, y_train으로

model.fit(X_train, y_train) 후에 pred= model.predict(X_test) 를 하면 결과가 더 좋을까요?

 

조금 더 성능을 높일 수 있는 방법인지 궁금해서 문의드립니다!

답변 1

0

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

이건 그럴 수도 있고 아닐 수도 있습니다.

합쳐서 진행하는 것이 성능이 향상 되야 하는 것은 맞으나

실제로 해보면 튜닝이 val을 나눈 train에 최적화 되어있다보니

오히려 성능이 떨어지기도 했어요 :)

이건 제 경험이고 정확하겐 알 수 없음이에요~

 

성능향상을 위해서는

  1. 모델 튜닝

  2. 데이터 전처리

등이 있습니다.

 

 

 

dlwjddn0905님의 프로필 이미지
dlwjddn0905
질문자

감사합니다!! 무슨말씀인지 이해했어요!

가르쳐주신 내용으로 꼭 합격해서 오겠습니다 ㅎㅎ~

dlwjddn0905님의 프로필 이미지
dlwjddn0905

작성한 질문수

질문하기