인프런 커뮤니티 질문&답변

duddl님의 프로필 이미지
duddl

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

작업형2 모의문제1

작업형2모의문제1 / 평가 (predict/predict_proba)질문

해결된 질문

작성

·

266

·

수정됨

0

안녕하세요. 작업형2 모의문제1에서 평가 시

roc_auc_score를 쓸 때는 predict_proba와,

roc_auc_score(y_val, pred[:,1])형태를,

 

나머지 평가 방법을 쓸 때는 predict와

(y_val, pred)형태를 쓰시던데요!!

 

문제에서 신용카드 이탈 확률을 찾는거라 predict_proba라고 생각했는데,

그냥 predict를 쓰는 것은 평가 방법 때문인가요? (일단 roc제외한 평가에는 predict를 쓰고 마지막 제출 시 proba로 다시 예측하는건지?)

 

 

  1. 수치형 컬럼 전처리에서

    col=['age', 'bmi', 'children'] <-수치형 컬럼나열

    from sklearn.preprocessing StandardScaler

    scaler=StandardScaler

    train[col]=scaler.fit_transform(train[col])

    test[col]=scaler.transform(test[col])형태로 전처리를 하면

    keyError: "None of [Index(['age', 'bmi', 'children'], dtype='object')] are in the [index]"

이런 에러가 자꾸 발생하는데 어디가 잘못된건지 궁금합니다!!

답변 1

0

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

  1. 확률을 묻는 문제라 predict_proba가 맞습니다 !!

    다만 다른 평가 지표도 보여주기 위해 함께 사용했어요!!

  2. train과 test 데이터프레임에 ['age', 'bmi', 'children'] 중 없는 컬럼이 있나요?

    train과 test를 출력해 눈으로 확인해주세요!

duddl님의 프로필 이미지
duddl
질문자

감사합니다~~!

duddl님의 프로필 이미지
duddl

작성한 질문수

질문하기