인프런 커뮤니티 질문&답변

greyy님의 프로필 이미지
greyy

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

작업형2 모의문제3

분류 모델 평가 관련

해결된 질문

작성

·

281

0

안녕하세요 빠른 답변 주셔서 공부에 많은 도움이 되고 있어 감사드립니다.

roc_auc_score 평가 시에만 accuracy, precision, recall, f1 과 다르게 predict_proba를 사용하는 이유 궁금합니다

 

답변 1

0

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

predict_proba에서 나온 확률값은 ROC 곡선 생성(TPR, FPR 계산)에 사용됩니다.
수식을 빼고 설명하면 아래와 같습니다.

  1. roc 커브

    1. TPR (전체 양성 중 양성으로 예측된 비율) -> 1에 가까울 수록 좋음

    2. FPR (전체 음성 중 양성으로 잘못 예측된 비율) -> 0에 가까울 수록 좋음

    3. 스레스홀드(threshold) 각 임계값마다 TPR/FPR계산 -> 곡선이 그려져요

  2. auc: roc 아래 면적 계산

    1. 면적 계산 결과 0.5보다 못하면 성능이 좋지 않은 모델임

       

greyy님의 프로필 이미지
greyy

작성한 질문수

질문하기