인프런 커뮤니티 질문&답변

모레님의 프로필 이미지
모레

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

상관관계

다음 상관관계 결과 중 가장 큰 값은 무엇일까요?

해결된 질문

작성

·

17

0

image.png

상관관계 값이 가장 큰값에 대한 질문입니다.

값을 찾을 때 독립변수(x1~x4)만을 비교하여 값을 찾으면 될까요? 아니면 종속변수( y)를 포함하여 가장 큰 값을 찾으면 될까요?

처음에는 0.822594 이라고 생각했는데 문제에서 x변수들간의 상관관계를 물어보는 것 같아 -0.224881라 생각하는데...

가장 큰 값에 대하여 헷갈리네요^^:

 

답변 2

0

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

의도한 바는 x1~x4까지의 상관관계였어요

시험에서는 명확하게 안내할 것으로 보여집니다!

0

안녕하세요, 인프런 AI 인턴입니다. 모레님.

상관관계 결과에 대한 질문을 주셨군요. 상관계수를 계산할 때의 주 목적을 이해하는 것이 중요합니다. 일반적으로 상관관계 분석에서는 다음과 같은 두 가지 경우가 있을 수 있습니다:

  1. 독립변수들 간의 상관관계: x 변수들 자체의 상관관계를 분석함으로써 각 변수들 간의 영향이나 중복성을 판단합니다. 이 경우, 특정 변수 ( x1, x2, x3, x4 ) 간의 상관관계만을 비교합니다.
  2. 독립변수와 종속변수 간의 상관관계: 독립변수 ( x1, x2, x3, x4 ) 각각이 종속변수 ( y )와 얼마나 상관이 있는지를 분석합니다. 이는 모델의 설명력을 높이고자 할 때 중요합니다.

질문에서 “독립변수들 간의 상관관계”를 물어보고 있다면, ( x1, x2, x3, x4 ) 사이의 값을 찾으면 좋습니다. 그러나 종속변수 ( y )를 포함해서 “가장 큰 상관계수”를 찾고자 한다면 ( y )와의 관계도 고려해야 합니다.

기재하신 ( x2 )와 ( x4 )의 -0.224881은 독립변수들 간의 상관관계를 고려한 값으로 보이네요. 상관관계가 가장 높은 값은 일반적으로 절대값이 큰 값으로 판단하곤 합니다. 만약 ( y )를 포함해서 검토했다면, ( x ) 변수들과 ( y )의 관계에서 0.822594 같은 큰 양의 상관계수를 확인할 수 있습니다.

유사한 주제를 다룬 토픽으로는 다음 질문과 답변을 참고하실 수 있습니다:
- 상관계수 큰 값: 상관계수의 절댓값과 최댓값을 구할 때의 주의점에 대한 설명.

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다. 현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏 추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

모레님의 프로필 이미지
모레

작성한 질문수

질문하기