인프런 커뮤니티 질문&답변

garlic78님의 프로필 이미지

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

예시문제 작업형2(신 버전) 🆕 updated 2023.11

predict 와 predict_proba

해결된 질문

24.06.07 17:27 작성

·

183

0

예측 결과를 ROC_AUC 평가 지표를 사용하라고 해서, predict_proba를 사용하면, 결과값이 1인 경우의 확률값(소수점 값)으로 나오는데, 예시 화면에서는 0 또는 1의 값으로 나타내게 되어 있어서, 평가시 predict로 해야할지 predict_proba를 적용해야 할지 다소 혼란스러운 부분이 있는데 실전에서 어떻게 해야 할까요?

답변 2

0

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

2024. 06. 08. 00:17

roc-auc는 확률을 평가하는 지표가 맞습니다.

그렇지만 predict값(0과 1)을 넣어도 됩니다. 성능이 다소 낮게 나타나요!

 

회귀도 만약 rmse와 같은 지표일때

2

3

4

라고 정수형으로 나와있다고

정수처리할 필요없어요! 소수점있는 그대로 제출하면 됩니다.

 

0

인프런 AI 인턴님의 프로필 이미지

2024. 06. 07. 17:31

안녕하세요, 인프런 AI 인턴입니다.

질문자님께서 평가 지표로 ROC_AUC를 사용하는 상황에서 predictpredict_proba 사이에서 어떤 방법을 사용해야 하는지 혼란스러워 하십니다. ROC_AUC 평가 지표는 예측 확률을 기반으로 하여 모델의 성능을 평가합니다. 특히, 이진 분류 문제에서는 긍정 클래스(예를 들어 ‘1’로 표시된 클래스)의 확률을 기준으로 ROC 곡선이 그려지므로 predict_proba를 사용하여 긍정 클래스에 대한 확률 값을 제출하셔야 합니다.

질문자님이 언급한 예시 화면에서 결과값이 0 또는 1로 나타나는 것은 predict 메소드를 사용했을 때의 일반적인 결과입니다. 이는 클래스의 최종 분류 결과를 나타내지만, ROC_AUC 같은 평가 지표를 사용할 때는 각각의 예측에 대한 확률 값이 필요합니다. 따라서, predict_proba를 사용하여 각 예측이 긍정 클래스에 속할 확률을 계산한 후, 이를 제출해야 합니다.

이와 관련된 유사한 질문에 대답한 예시들을 아래 링크에서 찾아보실 수 있습니다:

  • “체험 2유형 문제 질문”에서도, 평가지표가 ROC_AUC인 경우 predict_proba를 사용해서 확률값을 제출해야 한다고 설명되어 있습니다.
  • “predict_proba 와 predict” 질문에서 예측할 때 예측 값 작성시 ROC_AUC_SCORE 일때만 predict_proba를 사용해야 하는지에 대한 내용이 설명되어 있습니다.

질문자님의 경우도 평가 지표로 ROC_AUC를 사용한다 하였기 때문에 predict_proba를 이용하여 각 샘플이 긍정 클래스에 속할 확률을 제출하는 것이 올바른 접근입니다.

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

garlic78님의 프로필 이미지

작성한 질문수

질문하기