인프런 커뮤니티 질문&답변

khandong109님의 프로필 이미지
khandong109

작성한 질문수

[핵집] 2024 빅데이터 분석기사(필기)_과목 3~4

상관/회귀 방정식의 상관계수 및 수정된 상관계수 공식 문의

작성

·

153

·

수정됨

0

안녕하세요? 잘 듣고 있는 수강생입니다.

 

상관관계 관련하여 2차 회귀식에 대한 상관계수 및 수정된 상관계수 공식을 알려 주실수 있으신지요?

 

2차회귀식을 이용하여 분산분석표 작성 후, SSR/SST로 계산한 값이 결정계수로 보면 될런지요?

 

답변 3

0

소확성님의 프로필 이미지
소확성
지식공유자

안녕하세요, 소확성입니다.

해당 문의가 강의 내 내용이라면 관련 구간을 알려주실 수 있을까요?
강의 내용이 아니라 교재 내 깃허브 링크의 data를 활용한 학습 과정에서 문의라면
출판사(예문사) 홈페이지에 문의 부탁드립니다.

저희가 강의 내용에 대해 문답을 진행하고 있으나 강의 외 개인 학습에 대해서는 답변이 어려우니
이 점 양해 부탁드립니다.

강의 내용이라면 관련 회차 및 강의 영상 캡처 부탁드립니다.

감사합니다!

0

khandong109님의 프로필 이미지
khandong109
질문자

안녕하세요?

제가 X인자/ Y인자의 각 667개 DATA로 2차회귀방정식을 구했으며

이와 관련하여 분산분석표를 산출했는데..

수식(Excel)에는 R(b)가 "2595.7924"가 나왔는데

미니텝에서 그대로 돌렸을 경우, R(b)가 "1089.46"이 나왔어요..

왜 그런지 알수 있을지요?

 

image

 

 

 

image

0

소확성님의 프로필 이미지
소확성
지식공유자

안녕하세요, 소확성입니다!
문의 주신 사항에 대해 답변드립니다.

상관계수와 수정된 상관계수는 일반적으로 선형 회귀 모델에 대해 자주 사용되지만, 2차 (또는 더 높은 차수의) 회귀 모델에서도 유사한 개념을 적용할 수 있습니다. 2차 회귀 모델에 대한 상관계수 및 수정된 상관계수는 다음과 같이 계산할 수 있습니다.

 

1. 상관계수 (R²)

R²는 회귀 모델이 데이터를 얼마나 잘 설명하는지를 나타내는 척도입니다.

image여기서:

- SSres​는 잔차 제곱합 (Residual Sum of Squares)

- SStot​는 총 제곱합 (Total Sum of Squares)

 

2차 회귀 모델의 경우, 잔차는 다음과 같이 정의됩니다:

image총 제곱합은 다음과 같이 정의됩니다:

imageimage

2. 수정된 상관계수 (Adjusted R²)

수정된 상관계수는 모델의 설명력을 변수의 개수에 대해 조정한 값입니다. 수정된 R²는 다음과 같이 계산됩니다.

image

여기서:

  • nnn은 데이터 포인트의 수 (표본 크기)

    • ppp는 회귀 모델의 독립 변수 개수
      (2차 회귀 모델의 경우 상수항을 포함하여 3개: x, x2, 상수항)

       

       

      요약

      • 상관계수 (R²): 회귀 모델이 데이터를 얼마나 잘 설명하는지의 비율을 나타내는 값입니다.

      • 수정된 상관계수 (Adjusted R²): 모델의 설명력을 변수의 수에 대해 조정한 값입니다.

      이 개념들을 통해 2차 회귀 모델의 적합도를 평가할 수 있습니다. 2차 회귀 모델의 경우도 기본적으로 선형 회귀 모델과 동일한 방법으로 상관계수와 수정된 상관계수를 계산할 수 있습니다.

 

khandong109님의 프로필 이미지
khandong109
질문자

제가 하기 X1, Y1을 가지고 2차함수로 구하려고 하는데..

분산분석을 해보니 그 하단 이미지와 같이 나왔네요..

제가 분산분석을 잘못하여 나온거 같은데...

혹, 편차제곱합(SS)를 다시 상세히 하기 DATA를 이용(공식) 하여 알려 주실수 있으신지요?

<DATA>

image

<산출한 분산분석>

image

<미니텝>

image

소확성님의 프로필 이미지
소확성
지식공유자

2차 회귀 모델의 상관계수 및 수정된 상관계수를 구하기 위해 적절한 절차를 설명드리2차 회귀 모델의 상관계수 및 수정된 상관계수를 구하기 위해 적절한 절차를 설명드리면 다음과 같습니다.

image

image

이를 통해 올바른 분산분석 절차를 거쳐 2차 회귀 모델의 상관계수와 수정된 상관계수를 구할 수 있습니다.

khandong109님의 프로필 이미지
khandong109
질문자

image

SSR = 0.11267이 잘못 계산된거 같아서요..

이부분과 잔차 제곱합을 구하고 싶어서요..

미니텝이 맞는듯 하여 구해보고자 한것입니다.

 

 

khandong109님의 프로필 이미지
khandong109
질문자

그리고 또한, Raw DATA 수량이 700개 정도 되는데.. 이를 가지고 분산분석표를 작성하는것이 무의미한가요?

khandong109님의 프로필 이미지
khandong109

작성한 질문수

질문하기