인프런 커뮤니티 질문&답변

김진주님의 프로필 이미지
김진주

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

일원 분산 분석 🆕 updated 2023.10

회귀분석 및 사후검정

해결된 질문

작성

·

39

0

안녕하세요 선생님,

  1. 회귀분석

     

    ols(종속변수~독립변수, data=df).fit()

위 코드에서 fit()은 반드시 넣어줘야 하는 부분인가요? 머신러닝이 아닌 회귀분석을 실시할 때 학습(fit)을 시키는 것이 생소하기도 하고... R과 코드가 유사하다고 하셨는데 R에서는 fit()을 사용하지 않았던 것 같아서 조금 헷갈립니다. 챗gpt에 물어보니 fit()을 호출하지 않으면 회귀모델을 정의만 할 뿐 실제 계산이나 검정이 되지 않는다고 설명하던데.. 그럼 여기에서는 fit을 '학습'보다는 '분석'이라고 이해해도 될까요?

 

  1. 분산분석

사후검정(투키와 본페로니)은 df_melt(데이터 재구조화)에서만 작동하나요? 아래와 같이 df['A'] 등 집단을 쭉 입력하면 안되는 것 같아서요

tukey_result = pairwise_tukeyhsd(df['A'], df['B'], df['C'], df['D'], alpha=0.05)

답변 1

0

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

  1. r과 유사한 부분은 fomula 부분입니다. 네 fit()은 반드시 필요해요!

    1. fit()은

      1. 작업형2(머신러닝)에서는 학습(Training)이라고 표현하고 있고,

      2. 작업형3(통계)에서는 적합이라고 표현힙니다. (표현 방식의 차이가 있어요)

        1. 시험문제에서도 통계 교수님이 출제한다면 적합이란 표현을 사용할 거에요!

  2. 분산분석

    1. 사후검정은

      1. 학습에서 제외 하시죠!!

      2. 심화학습으로 출제가능성이 낮아 보입니다.

      3. 네 입력 자체가 피벗으로 재구조화가 필요합니다.

         

김진주님의 프로필 이미지
김진주

작성한 질문수

질문하기