인프런 커뮤니티 질문&답변

규다님의 프로필 이미지
규다

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

모델링 및 평가(분류)

섹션 3 : "머신러닝"과 줄다리기

해결된 질문

작성

·

212

0

안녕하세요.

빅데이터 분석기사 교재 보다가 비전공자라 그런지 조금 어려워서 인강까지 흘러오게 되었네요. 앞으로 잘 부탁드립니다 : )

섹션 3 : "머신러닝"과 줄다리기 > 모델링 및 평가(분류) 문제 1번을 아래 링크와 같이 풀어보았습니다.

혹시 이런식으로 푸는게 맞는건지 봐주실 수 있을까요?

https://colab.research.google.com/drive/17FKBC1yxD5yHil49ubGXElCm2Tq40kDs#scrollTo=n8EH3M_AgD4k

답변 1

2

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

첫 분류 강의에서 이 정도 풀이면 훌륭합니다! 문제 풀이로 들어가도 될 정도의 실력이네요!!

  1. 다만 roc_auc 평가지표를 사용한다면 predict(0또는1)이 아니라 predict_proba(0일 확률과 1일 확률)을 사용해야 해요 :)
    predict을 사용해도 수식상 오류가 나진 않고 성능이 조금 떨어집니다.

  2. 추가로 이 부분은 틀린 것은 아닌데 train_test_split을 사용할 때 test라는 변수명으로 받게 되면 나중에 진짜 test데이터와 헷갈릴 수 있어요. validation또는 val과 같은 다른 변수명을 쓰는 것이 좋을 것 같아요!

응원하겠습니다👍

규다님의 프로필 이미지
규다
질문자

roc_auc 평가지표 사용 시, predict_proba! 감사합니다.

규다님의 프로필 이미지
규다

작성한 질문수

질문하기