인프런 커뮤니티 질문&답변

khandong109님의 프로필 이미지

작성한 질문수

[핵집] 2024 빅데이터 분석기사(필기)_과목 3~4

상관/회귀 방정식의 상관계수 및 수정된 상관계수 공식 문의

24.07.11 16:32 작성

·

144

·

수정됨

0

안녕하세요? 잘 듣고 있는 수강생입니다.

 

상관관계 관련하여 2차 회귀식에 대한 상관계수 및 수정된 상관계수 공식을 알려 주실수 있으신지요?

 

2차회귀식을 이용하여 분산분석표 작성 후, SSR/SST로 계산한 값이 결정계수로 보면 될런지요?

 

답변 3

0

소확성님의 프로필 이미지
소확성
지식공유자

2024. 07. 16. 09:43

안녕하세요, 소확성입니다.

해당 문의가 강의 내 내용이라면 관련 구간을 알려주실 수 있을까요?
강의 내용이 아니라 교재 내 깃허브 링크의 data를 활용한 학습 과정에서 문의라면
출판사(예문사) 홈페이지에 문의 부탁드립니다.

저희가 강의 내용에 대해 문답을 진행하고 있으나 강의 외 개인 학습에 대해서는 답변이 어려우니
이 점 양해 부탁드립니다.

강의 내용이라면 관련 회차 및 강의 영상 캡처 부탁드립니다.

감사합니다!

0

khandong109님의 프로필 이미지
khandong109
질문자

2024. 07. 16. 08:42

안녕하세요?

제가 X인자/ Y인자의 각 667개 DATA로 2차회귀방정식을 구했으며

이와 관련하여 분산분석표를 산출했는데..

수식(Excel)에는 R(b)가 "2595.7924"가 나왔는데

미니텝에서 그대로 돌렸을 경우, R(b)가 "1089.46"이 나왔어요..

왜 그런지 알수 있을지요?

 

image

 

 

 

image

0

소확성님의 프로필 이미지
소확성
지식공유자

2024. 07. 12. 18:08

안녕하세요, 소확성입니다!
문의 주신 사항에 대해 답변드립니다.

상관계수와 수정된 상관계수는 일반적으로 선형 회귀 모델에 대해 자주 사용되지만, 2차 (또는 더 높은 차수의) 회귀 모델에서도 유사한 개념을 적용할 수 있습니다. 2차 회귀 모델에 대한 상관계수 및 수정된 상관계수는 다음과 같이 계산할 수 있습니다.

 

1. 상관계수 (R²)

R²는 회귀 모델이 데이터를 얼마나 잘 설명하는지를 나타내는 척도입니다.

image여기서:

- SSres​는 잔차 제곱합 (Residual Sum of Squares)

- SStot​는 총 제곱합 (Total Sum of Squares)

 

2차 회귀 모델의 경우, 잔차는 다음과 같이 정의됩니다:

image총 제곱합은 다음과 같이 정의됩니다:

imageimage

2. 수정된 상관계수 (Adjusted R²)

수정된 상관계수는 모델의 설명력을 변수의 개수에 대해 조정한 값입니다. 수정된 R²는 다음과 같이 계산됩니다.

image

여기서:

  • nnn은 데이터 포인트의 수 (표본 크기)

    • ppp는 회귀 모델의 독립 변수 개수
      (2차 회귀 모델의 경우 상수항을 포함하여 3개: x, x2, 상수항)

       

       

      요약

      • 상관계수 (R²): 회귀 모델이 데이터를 얼마나 잘 설명하는지의 비율을 나타내는 값입니다.

      • 수정된 상관계수 (Adjusted R²): 모델의 설명력을 변수의 수에 대해 조정한 값입니다.

      이 개념들을 통해 2차 회귀 모델의 적합도를 평가할 수 있습니다. 2차 회귀 모델의 경우도 기본적으로 선형 회귀 모델과 동일한 방법으로 상관계수와 수정된 상관계수를 계산할 수 있습니다.

 

khandong109님의 프로필 이미지
khandong109
질문자

2024. 07. 15. 09:08

제가 하기 X1, Y1을 가지고 2차함수로 구하려고 하는데..

분산분석을 해보니 그 하단 이미지와 같이 나왔네요..

제가 분산분석을 잘못하여 나온거 같은데...

혹, 편차제곱합(SS)를 다시 상세히 하기 DATA를 이용(공식) 하여 알려 주실수 있으신지요?

<DATA>

image

<산출한 분산분석>

image

<미니텝>

image

소확성님의 프로필 이미지
소확성
지식공유자

2024. 07. 15. 09:37

2차 회귀 모델의 상관계수 및 수정된 상관계수를 구하기 위해 적절한 절차를 설명드리2차 회귀 모델의 상관계수 및 수정된 상관계수를 구하기 위해 적절한 절차를 설명드리면 다음과 같습니다.

image

image

이를 통해 올바른 분산분석 절차를 거쳐 2차 회귀 모델의 상관계수와 수정된 상관계수를 구할 수 있습니다.

khandong109님의 프로필 이미지
khandong109
질문자

2024. 07. 15. 10:22

image

SSR = 0.11267이 잘못 계산된거 같아서요..

이부분과 잔차 제곱합을 구하고 싶어서요..

미니텝이 맞는듯 하여 구해보고자 한것입니다.

 

 

khandong109님의 프로필 이미지
khandong109
질문자

2024. 07. 16. 08:34

그리고 또한, Raw DATA 수량이 700개 정도 되는데.. 이를 가지고 분산분석표를 작성하는것이 무의미한가요?