해결된 질문
작성
·
266
·
수정됨
0
안녕하세요. 작업형2 모의문제1에서 평가 시
roc_auc_score를 쓸 때는 predict_proba와,
roc_auc_score(y_val, pred[:,1])형태를,
나머지 평가 방법을 쓸 때는 predict와
(y_val, pred)형태를 쓰시던데요!!
문제에서 신용카드 이탈 확률을 찾는거라 predict_proba라고 생각했는데,
그냥 predict를 쓰는 것은 평가 방법 때문인가요? (일단 roc제외한 평가에는 predict를 쓰고 마지막 제출 시 proba로 다시 예측하는건지?)
수치형 컬럼 전처리에서
col=['age', 'bmi', 'children'] <-수치형 컬럼나열
from sklearn.preprocessing StandardScaler
scaler=StandardScaler
train[col]=scaler.fit_transform(train[col])
test[col]=scaler.transform(test[col])형태로 전처리를 하면
keyError: "None of [Index(['age', 'bmi', 'children'], dtype='object')] are in the [index]"
이런 에러가 자꾸 발생하는데 어디가 잘못된건지 궁금합니다!!
답변 1
0
확률을 묻는 문제라 predict_proba가 맞습니다 !!
다만 다른 평가 지표도 보여주기 위해 함께 사용했어요!!
train과 test 데이터프레임에 ['age', 'bmi', 'children'] 중 없는 컬럼이 있나요?
train과 test를 출력해 눈으로 확인해주세요!
감사합니다~~!