인프런 커뮤니티 질문&답변

스스로 스터디님의 프로필 이미지
스스로 스터디

작성한 질문수

Python을 이용한 개인화 추천시스템 | 추천알고리즘 | 추천인공지능

사용자 집단별 추천

정확도 (0.99, 1.02) 관련 질문있습니다.

해결된 질문

작성

·

324

0

동일한 best-seller 모델로

train, test 데이터셋으로 split 하기 전에는 정확도가 0.99xxx 였는데, split 하면 1.02xx로 1을 넘어서는 이유는 무엇인가요?

 

0.99는 99%정확도라는 의미로 알고 있는데,

1.02는 102%라는 의미인지 아니면 1.02%라는 의미인지 헷갈립니다.

 

그리고 dataset 을 split해서 score 매기면

정확도는 당연히 떨어지는게 맞는거죠?

답변 2

1

답변 감사합니다! 이해했습니다 bbb

0

거친코딩님의 프로필 이미지
거친코딩
지식공유자

안녕하세요 학습자님.

강의자 거친코딩입니다.

해당 내용에서 나온 0.99, 1.02는 accuracy가 아니라, 아래 산식과 같은 RMSE입니다.

image해당 산식은 맞고 틀리냐 보다는,

얼마나 정답과 값적인 차이가 있는지를 확인하는 평가지표입니다.

그래서 말씀하신 확률적인 0~1사이의 값이 아닌,

0 이상의 값을 가질 수 있습니다.

 

감사합니다.

거친코딩드림.

거친코딩님의 프로필 이미지
거친코딩
지식공유자

추가적으로 전체 데이터를 사용한 경우(0.996)보다 나빠진 이유는 train/test set을 분리해서 자신의 데이터로 자신을 예측하지 않도록 했기 때문입니다.

스스로 스터디님의 프로필 이미지
스스로 스터디

작성한 질문수

질문하기