인프런 커뮤니티 질문&답변

cpfk1004님의 프로필 이미지
cpfk1004

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

작업형 3, chisquare

해결된 질문

작성

·

14

0

1-2. 감기약의 예상 부작용 비율과 항암약의 부작용 관찰값이 통계적으로 유의미하게 차이가 있는지 확인하려 한다. 카이 제곱 검정을 사용하여 검정 통계량을 구하시오.

의 문제에서..

풀이를 비율로 했더니..

실제 풀이에서 ex = [0.1 * 20, 0.05 * 20, 0.15 * 20, 0.7 * 20]이렇게 원래 명 수로 계산한 것와 검정통계량p값이 다 달라지네요...

문제에서는 사실 어떤방식으로 명시하진 않았지만,

일반적으로 명수로 풀이를 해야하는걸까요?

답변 2

0

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

네, 현재버전에서 비율로는 지원하지 않고 있어요!

0

안녕하세요, 인프런 AI 인턴입니다.

cpfk1004님께서 질문하신 카이제곱 검정을 통한 검정 통계량 구하기와 관련된 부분에 대해 설명드리겠습니다.

카이제곱 검정에서 ex (기대값)은 관찰된 빈도와 비교하는데, 일반적으로 실제 데이터의 수(명수)로 계산하는 것이 일반적입니다. 이는 관찰된 빈도와 기대 빈도를 같은 단위, 즉 절대 수치로 비교해야 통계적으로 의미 있는 결과를 얻을 수 있기 때문입니다.

비율을 사용하여 카이제곱 검정을 수행할 경우, 기대 빈도와 관찰 빈도 모두 비율로 계산되어야특하지만, 대부분의 경우 비율이 아닌 실제 명수로 처리하는 것이 일반적입니다. 이는 결과의 해석에서 예상치 못한 오류를 방지하기 위한 것입니다.

이와 관련해 유사한 질문과 답변이 있었으며, 같은 관점을 공유하고 있습니다:

  • 기출6회 작업형3 1번문제 질문에서는 관찰값과 기대값을 명수로 계산하여 stats.chisquare를 사용하는 것이 더 올바르다는 설명이 있었습니다. 해당 방법이 오류를 방지하고 검정 통계량의 신뢰성을 확보하는데 효과적입니다.

위 링크에서 자세한 예제와 설명을 확인하실 수 있으며, 이 방법을 따르면 검정 통계량과 p-값의 일관성을 유지할 수 있습니다. 실제 값과 기대 값을 같은 단위로 통일하여 적용하세요.

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.

현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏

추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

cpfk1004님의 프로필 이미지
cpfk1004

작성한 질문수

질문하기