인프런 커뮤니티 질문&답변

진승섭님의 프로필 이미지
진승섭

작성한 질문수

확률과 통계 101

상관성 분석

피셔의 z변환 질문

해결된 질문

작성

·

88

0

피셔의 z변환은 어떻게 해서 나온것인가요?

어떻게 해서 저런 식이 나왔죠?

그리고 정규분포를 따른다는게 정확히 따른다는 말인가요(식도 동일한 형태) 아니면 정규분포의 형태를 따른다는 것인가요? (평균에 대해 빈도수가 높고 평균을 기준으로 멀어질 수록 빈도가 줄어들며 대략적으로 대칭인 정규분포와 비슷한 형태)

답변 2

1

루비네 코딩님의 프로필 이미지
루비네 코딩
지식공유자

안녕하세요:

중요한 질문에 감사합니다 ^^

1). 피셔의 z 변환의 필요성.

"중심극한정리"에서 알아 보았듯이 일반적인 경우 (표본으로 계산한 통계량)/(표준 오차)의 분포는

표본의 크기가 커질수록 표준정규분포를 따른다는 전제를 할 수 있습니다.

이 특성을 바탕으로 신뢰구간을 도출해 낼 수 있습니다. (Section 3, "구간추정" 참고, 강의자료 71p ~ 72p).

그런데, 상관계수는 [-1, +1] 구간에 속해야 하기 때문에 가장자리 (-1 또는 +1)에 가까울

수록 상관계수의 분포는 일그러져 정규분포에서 벗어난 형상을 보입니다.

결과적으로 (표본으로 계산한 상관계수)/(표준 오차) 또한 표준정규분포에서 벗어난 형상을 보입니다.

그러니까 -1과 +1의 위치에는 상관계수가 지나갈 수 없는 "벽" 또는 "테두리"가 있다고 상상해 볼 수 있습니다. (Section 3, 강의자료 93p ~ 94p 그림 참고).

신뢰구간을 만들려면 상관계수의 분포가 정규분포와 "유사한" 형상이 되도록 변환이 필요합니다.

그 역할을 피셔의 z 변환이 담당하게 됩니다.

상관계수의 분포는 피셔의 z 변환 이후 "테두리"의 영향이 줄어들고 정규분포에 "근접한" 형상을 보이게 됩니다.

2). 상관계수의 분포는 피셔의 z 변환이후 "정확하게" 정규분포를 따르는가?

아닙니다. 역쌍곡선 탄젠트 (atctanh)를 사용하는 피셔의 변환은 단지 테두리 (-1과 +1)의 영향을 줄여주는 효과를 보입니다.

"중심극한정리" 조차도 "정확하게" 정규분포를 따른다는 주장을 하고 있지는 않습니다. 단지 "중심" 부분에서 정규분포로 "근접" (approximate)할 수 있다는 주장을 하고 있습니다.

다소 어려운 주제인데 조금이나마 학습 하시는데 도움이 되시기를 바래 봅니다.

감사합니다.

Ruby네 코딩~

0

안녕하세요, 인프런 AI 인턴입니다.

진승섭님,

피셔의 z 변환(Fisher’s z-transformation)은 상관 계수를 r에서 정규 분포에 가까운 z값으로 변환하는 방법입니다. 이 변환은 특히 작은 샘플 크기에서도 상관 계수의 분포를 정규 분포에 가깝게 만들어 주는 좋은 성질을 가지고 있습니다.

피셔의 z 변환 유도

피셔의 z 변환 공식은 다음과 같습니다:
[ z = \frac{1}{2} \ln \left( \frac{1 + r}{1 - r} \right) ]

이 공식은 상관 계수 r을 변환하여 정규 분포의 특성을 확보하는 방법입니다. 이때, r은 -1에서 1 사이의 값을 가지며, z 값은 실수 전체에 걸쳐 퍼져 있습니다.

정규 분포를 따른다는 뜻

피셔의 z 변환이 정규 분포를 ‘따른다’는 것은 다음과 같은 의미를 가집니다:
- 변환된 z 값이 정규 분포의 형태를 따릅니다.
- 평균 0과 분산 (\frac{1}{n-3})을 가지는 정규 분포입니다.

즉, 변환된 z값은 평균에 대해 빈도수가 높고, 평균을 기준으로 멀어질수록 빈도가 줄어드는 대칭적 형태를 갖춘 정규 분포에 가깝다는 의미입니다.

정확한 내용이나 공식 등 추가적인 질문이 있으면 수강 전 문의 게시판에서 질문을 남기시면 더욱 자세한 답변을 받으실 수 있습니다.

감사합니다.

진승섭님의 프로필 이미지
진승섭

작성한 질문수

질문하기