인프런 커뮤니티 질문&답변

구혜미님의 프로필 이미지

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

모의고사 3 - 작업형 2번 문제

해결된 질문

24.06.15 10:06 작성

·

64

·

수정됨

0

모델 학습 및 예측에서 roc_auc_score 가 1이 나와버려서 뭔가 이상하게 학습을 시킨 것 같은데 괜찮은건가요? 그리고 X_test 를 이용해서 predict 할 때는 타겟값인 TravelInsurance 가 없어야하는 것 아닌가요? 왜 오류가 나는지 모르겠습니다...

 

아래는 어떤 식으로 전처리되었는지 X_tr과 X_test 입니다!

답변 1

0

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

2024. 06. 15. 12:58

우선 모의고사가 아니라 기출3이 맞죠?

1점이 나온 것은 문제가 있는 것이 맞아요!

X_tr데이터를 보면 TravelInsurance가 포함되어 있어요

다른 말로 하면 답안지가 이미 포함되어 있어서 모두 정답을 알고 예측하는 것입니다.

 

 

따라서 X_test를 예측할 때 에러가 나는 것은

X_tr에는 TravelInsurance가 없어서 에러가 납니다.

 

해결방법은 데이터를 분리하는 코드 또는 그 전에 TravelInsurance를 학습용 데이터에서 제외해야 합니다.

강의 참고 부탁드려요!