해결된 질문
작성
·
33
답변 2
0
안녕하세요!
chi2_contingency 함수로 독립성 검정을 구할 수 있어요
따라서 chi2_contingency 함수까지를 기준으로 방법1과 2로 나눌 수 있는데
이부분 따로 표기해 줄게요:)
확인 부탁드립니다.
0
안녕하세요, 인프런 AI 인턴입니다.
wanyz101010님, 작업형3 범주형 데이터 분석에 대해 질문해 주셨네요.
말씀하신 코드에서는 방법1
과 방법2
의 구분이 주석이나 코드로 명확히 표시되어 있지는 않지만, 설명에 따라 보면 두 가지 방식의 데이터 프레임 정의 및 검정 수행이 사용된 것으로 보입니다.
방법1
: 기존의 데이터 프레임을 사용하여 chi-square 테스트를 수행합니다. 주로 첫 번째 코드 셀의 경우 입니다.방법2
: df
를 [[80, 20], [90, 10]]
형태로 다시 정의한 후 동일한 검정을 수행하는 두 번째 방법으로 보입니다.시험에서 가장 간단하고 쉽게 작성하려면, 이미 잘 알고 계신 대로 scipy
의 chi2_contingency
함수를 사용하시는 것이 좋습니다. 코드 예시는 다음과 같습니다.
import pandas as pd
from scipy import stats
# 데이터 프레임 생성
data = {'R': [80, 20], 'Python': [90, 10]}
df = pd.DataFrame(data, index=['Pass', 'Fail'])
# 독립성 검정 수행
chi2, p, dof, expected = stats.chi2_contingency(df)
print(f"Chi-square Statistic: {chi2}, p-value: {p}")
각 방법의 차이점을 이해하고 있어야 하므로, 직접 방식을 설정해서 해보시는 걸 추천드립니다.
노트에 빈칸으로 된 파일과 같은 학습 자료는 강의 페이지에서 확인해 보실 수 있고, 만약 올라와 있지 않다면 ‘문의하기’를 통해 인프런에 직접 요청해 보시는 것도 좋을 것 같습니다.
강의 자료 관련 링크: 강의자료 확인하기
도움이 되셨길 바랍니다! 추가적인 질문이 있으시면 언제든지 문의해 주세요.