해결된 질문
작성
·
88
답변 2
1
안녕하세요:
중요한 질문에 감사합니다 ^^
1). 피셔의 z 변환의 필요성.
"중심극한정리"에서 알아 보았듯이 일반적인 경우 (표본으로 계산한 통계량)/(표준 오차)의 분포는
표본의 크기가 커질수록 표준정규분포를 따른다는 전제를 할 수 있습니다.
이 특성을 바탕으로 신뢰구간을 도출해 낼 수 있습니다. (Section 3, "구간추정" 참고, 강의자료 71p ~ 72p).
그런데, 상관계수는 [-1, +1] 구간에 속해야 하기 때문에 가장자리 (-1 또는 +1)에 가까울
수록 상관계수의 분포는 일그러져 정규분포에서 벗어난 형상을 보입니다.
결과적으로 (표본으로 계산한 상관계수)/(표준 오차) 또한 표준정규분포에서 벗어난 형상을 보입니다.
그러니까 -1과 +1의 위치에는 상관계수가 지나갈 수 없는 "벽" 또는 "테두리"가 있다고 상상해 볼 수 있습니다. (Section 3, 강의자료 93p ~ 94p 그림 참고).
신뢰구간을 만들려면 상관계수의 분포가 정규분포와 "유사한" 형상이 되도록 변환이 필요합니다.
그 역할을 피셔의 z 변환이 담당하게 됩니다.
상관계수의 분포는 피셔의 z 변환 이후 "테두리"의 영향이 줄어들고 정규분포에 "근접한" 형상을 보이게 됩니다.
2). 상관계수의 분포는 피셔의 z 변환이후 "정확하게" 정규분포를 따르는가?
아닙니다. 역쌍곡선 탄젠트 (atctanh)를 사용하는 피셔의 변환은 단지 테두리 (-1과 +1)의 영향을 줄여주는 효과를 보입니다.
"중심극한정리" 조차도 "정확하게" 정규분포를 따른다는 주장을 하고 있지는 않습니다. 단지 "중심" 부분에서 정규분포로 "근접" (approximate)할 수 있다는 주장을 하고 있습니다.
다소 어려운 주제인데 조금이나마 학습 하시는데 도움이 되시기를 바래 봅니다.
감사합니다.
Ruby네 코딩~
0
안녕하세요, 인프런 AI 인턴입니다.
진승섭님,
피셔의 z 변환(Fisher’s z-transformation)은 상관 계수를 r에서 정규 분포에 가까운 z값으로 변환하는 방법입니다. 이 변환은 특히 작은 샘플 크기에서도 상관 계수의 분포를 정규 분포에 가깝게 만들어 주는 좋은 성질을 가지고 있습니다.
피셔의 z 변환 공식은 다음과 같습니다:
[ z = \frac{1}{2} \ln \left( \frac{1 + r}{1 - r} \right) ]
이 공식은 상관 계수 r을 변환하여 정규 분포의 특성을 확보하는 방법입니다. 이때, r은 -1에서 1 사이의 값을 가지며, z 값은 실수 전체에 걸쳐 퍼져 있습니다.
피셔의 z 변환이 정규 분포를 ‘따른다’는 것은 다음과 같은 의미를 가집니다:
- 변환된 z 값이 정규 분포의 형태를 따릅니다.
- 평균 0과 분산 (\frac{1}{n-3})을 가지는 정규 분포입니다.
즉, 변환된 z값은 평균에 대해 빈도수가 높고, 평균을 기준으로 멀어질수록 빈도가 줄어드는 대칭적 형태를 갖춘 정규 분포에 가깝다는 의미입니다.
정확한 내용이나 공식 등 추가적인 질문이 있으면 수강 전 문의 게시판에서 질문을 남기시면 더욱 자세한 답변을 받으실 수 있습니다.
감사합니다.