인프런 커뮤니티 질문&답변

Cindy Jeon님의 프로필 이미지
Cindy Jeon

작성한 질문수

실리콘밸리 엔지니어와 함께하는 데이터 사이언스 기초편

Linear Regression(선형 회귀 모델)에 대해 알아보기

선형회기 모델 r2 계산방법

작성

·

40

0

안녕하세요

선형회기모델 강의 내용 중 12:42분 ppt에서 Sum of squared residual이 SS_res로 되어있는데, 이 용어에 대한설명이 관측값과 회기 예측값의 차이로 으로 되어있습니다.

그렇다면 이는 SSE(error sum of squares)와 동일한 것으로 수식이 (SS-res / SS_tot),

즉 SSE/SST 로 변경되어야 하지 않을까요?

(SS_res와 SSE를 동일한 뜻으로 간주한다면)

 

하지만 현재 자료는 1- (SS_res/SST)로 되어있고, 이 케이스는 SS_res가 회기값과 관측값 평균의 차, 즉 regression sum of squares 와 동일한 의미로 설명되어 있습니다.

아마 SSR(SS_res)의 용어와 SSR(regression sum of squares)의 용어 혼돈인것 같은데 작성하신 뜻에 의하면 "1-"부분이 삭제되어야 할것 같아서 문의 남깁니다.

확인부탁드립니다.

답변 1

0

미쿡엔지니어님의 프로필 이미지
미쿡엔지니어
지식공유자

안녕하세요 Cindy Jeon님,

SS_res (Sum of Squared Residuals) as the sum of the squared differences between the actual target values (the observed values) and the predicted target values (the values predicted by the model)

이 부분을 말씀하시는 거 같은데 제가 혹시나해서 찾아봤는데, 맞는 내용입니다만...

한글로 하면, 실제 타겟 값(관측된 값)과 모델이 예측한 타겟 값(모델의 예측 값) 사이의 차이의 제곱합을 의미합니다. 이 수치는 모델이 실제 데이터와 얼마나 잘 맞는지를 나타내며, SS_res 값이 작을수록 모델의 예측이 실제 데이터와 더 가까움을 나타내어, 더 좋은 모델 적합도를 의미합니다.

만약 1이 빠진 수식이라면 그것은 직접 SSE/SST를 나타내는 비율을 의미하는데, 이는 R²의 정의와 맞지 않으므로 1이 포함되어야 합니다

그리고 SSR은

Screenshot 2024-09-09 at 4.09.00 PM.png

맞지 않는 자료 같습니다만...

 

인터넷에 보시면 자료가 많은데, 제가 하나 가져와 봤습니다.

https://pub.towardsai.net/regression-metrics-6690815bb51f

 

Cindy Jeon님의 프로필 이미지
Cindy Jeon

작성한 질문수

질문하기