인프런 커뮤니티 질문&답변

gusmgl94님의 프로필 이미지
gusmgl94

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

예시문제 작업형2(신 버전) 🆕 updated 2023.11

예시문제 작업형2(신버전) 예측컬럼

해결된 질문

작성

·

166

0

안녕하세요 선생님,

질문드립니다~

 

에시문제 작업형2(신버전)에서 보면

1) roc_auc_score로 평가한다고 되어있지만,

2) 제출 csv 파일 형식 예시를 보면 확률값이 아닌 0또는1로 적혀있습니다.

 

그러면 제출할때 predict_proba가 아닌 predict로 예측한 결과값을 제출해야하는 것 아닌가요?

 

선생님이 작성하신 결과값이 확률값으로 되어있어 질문드립니다.

 

답변 2

0

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

roc_auc_score평가 지표로 점수를 채점해요!

  1. predict도 제출가능하고

  2. predict_proba (1확률값) 도 제출가능합니다.

모두 roc_auc_score 수식에서 문제는 없어요

다만 roc_auc는 확률 값으로 계산하는 것이 좋은 점수를 받을 수 있어요!

 

결론 roc_auc가 평가지표면 확률값을 제출해 주세요!

gusmgl94님의 프로필 이미지
gusmgl94
질문자

아 그렇군요~ 감사합니다~!

0

안녕하세요, 인프런 AI 인턴입니다.

gusmgl94님의 질문은 작업형 2 문제에서 roc_auc_score 평가 지표를 사용할 때 제출해야 하는 예측값의 형식(0과 1의 이진 값 혹은 확률 값)에 관한 것으로 이해됩니다. 이와 관련하여, [퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3) 강의의 지식 공유자께서 제공한 유사한 질문의 답변을 참조해 보면, roc_auc_score 평가 지표를 사용하는 경우, 예측 확률(predict_proba)을 제출하는 것이 적절한 것으로 설명되어 있습니다.

예를 들어, 예시문제 작업형2(신 버전) 관련 질문에서, 지식 공유자는 ROC_AUC 평가 지표는 각 예측에 대한 1이 속할 확률 정보로 계산되기 때문에, 1의 확률 값을 제출하는 것이 맞다고 설명하셨습니다. 또한, 모형 성능 테스트와 제출 모두 predict_proba를 사용하는 것이 일반적인 접근인 것으로 언급되어 있습니다.

답변에서 언급된 것처럼, ROC_AUC는 확률 값을 기반으로 하는 평가지표이기 때문에, 확률 값을 제출하면 각 클래스에 속할 확률을 바탕으로 모델의 성능을 더 정확하게 평가할 수 있습니다. 제출 양식 예시가 0과 1의 이진 값으로 되어 있다 하더라도, 실제로는 예측 확률을 제출하는 것이 관례입니다.

따라서, 선생님의 지침에 따라 예측 확률값을 제출하는 것이 적절하며, 제출 파일 형식 예시에서 보이는 0과 1의 값은 예시일 뿐, 평가 지표에 부합하는 확률값 제출이 요구됩니다.

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.

현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏

추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

gusmgl94님의 프로필 이미지
gusmgl94

작성한 질문수

질문하기