인프런 영문 브랜드 로고
인프런 영문 브랜드 로고

인프런 커뮤니티 질문&답변

wanyz101010님의 프로필 이미지

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

독립성 검정

작업형3 범주형 데이터 분석

해결된 질문

작성

·

33

0

image.pngimage.png

안녕하세요,

수업시간에 작업형3 독립성 검정(범주형 데이터 분석)에서 아래와 같은 방법들을 알려주셨는데요, 어디까지가 방법1이고 어디부터가 방법2인지 알 수 있을까요? 시험에서는 가장 쉬운 방법으로 하고 싶은데요, 독립성 검정에서 가장 간단하고 쉽게 코드를 작성하려면 어떻게 작성하면 되는건지 알려주시면 감사하겠습니다.

 

그리고 수업 노트에 빈칸으로 된 파일이 안 올라와 있던데, 올려주시면 감사하겠습니다.

답변 2

0

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

안녕하세요!

chi2_contingency 함수로 독립성 검정을 구할 수 있어요

따라서 chi2_contingency 함수까지를 기준으로 방법1과 2로 나눌 수 있는데

이부분 따로 표기해 줄게요:)

확인 부탁드립니다.

 

 

0

인프런 AI 인턴님의 프로필 이미지

안녕하세요, 인프런 AI 인턴입니다.
wanyz101010님, 작업형3 범주형 데이터 분석에 대해 질문해 주셨네요.

말씀하신 코드에서는 방법1방법2의 구분이 주석이나 코드로 명확히 표시되어 있지는 않지만, 설명에 따라 보면 두 가지 방식의 데이터 프레임 정의 및 검정 수행이 사용된 것으로 보입니다.

  1. 방법1: 기존의 데이터 프레임을 사용하여 chi-square 테스트를 수행합니다. 주로 첫 번째 코드 셀의 경우 입니다.
  2. 방법2: df[[80, 20], [90, 10]] 형태로 다시 정의한 후 동일한 검정을 수행하는 두 번째 방법으로 보입니다.

시험에서 가장 간단하고 쉽게 작성하려면, 이미 잘 알고 계신 대로 scipychi2_contingency 함수를 사용하시는 것이 좋습니다. 코드 예시는 다음과 같습니다.

import pandas as pd
from scipy import stats

# 데이터 프레임 생성
data = {'R': [80, 20], 'Python': [90, 10]}
df = pd.DataFrame(data, index=['Pass', 'Fail'])

# 독립성 검정 수행
chi2, p, dof, expected = stats.chi2_contingency(df)
print(f"Chi-square Statistic: {chi2}, p-value: {p}")

각 방법의 차이점을 이해하고 있어야 하므로, 직접 방식을 설정해서 해보시는 걸 추천드립니다.

노트에 빈칸으로 된 파일과 같은 학습 자료는 강의 페이지에서 확인해 보실 수 있고, 만약 올라와 있지 않다면 ‘문의하기’를 통해 인프런에 직접 요청해 보시는 것도 좋을 것 같습니다.

강의 자료 관련 링크: 강의자료 확인하기

도움이 되셨길 바랍니다! 추가적인 질문이 있으시면 언제든지 문의해 주세요.