인프런 커뮤니티 질문&답변

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

작업형2 모의문제1

작업형2모의문제1 / 평가 (predict/predict_proba)질문

해결된 질문

작성

·

282

·

수정됨

0

안녕하세요. 작업형2 모의문제1에서 평가 시

roc_auc_score를 쓸 때는 predict_proba와,

roc_auc_score(y_val, pred[:,1])형태를,

나머지 평가 방법을 쓸 때는 predict와

(y_val, pred)형태를 쓰시던데요!!

문제에서 신용카드 이탈 확률을 찾는거라 predict_proba라고 생각했는데,

그냥 predict를 쓰는 것은 평가 방법 때문인가요? (일단 roc제외한 평가에는 predict를 쓰고 마지막 제출 시 proba로 다시 예측하는건지?)

수치형 컬럼 전처리에서
col=['age', 'bmi', 'children'] <-수치형 컬럼나열
from sklearn.preprocessing StandardScaler
scaler=StandardScaler
train[col]=scaler.fit_transform(train[col])
test[col]=scaler.transform(test[col])형태로 전처리를 하면
keyError: "None of [Index(['age', 'bmi', 'children'], dtype='object')] are in the [index]"

이런 에러가 자꾸 발생하는데 어디가 잘못된건지 궁금합니다!!

python 머신러닝 빅데이터 pandas 빅데이터분석기사

답변 1

0

퇴근후딴짓

지식공유자

확률을 묻는 문제라 predict_proba가 맞습니다 !!
다만 다른 평가 지표도 보여주기 위해 함께 사용했어요!!
train과 test 데이터프레임에 ['age', 'bmi', 'children'] 중 없는 컬럼이 있나요?
train과 test를 출력해 눈으로 확인해주세요!

질문자

감사합니다~~!

작성한 질문수