해결된 질문
작성
·
443
0
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!
질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요
먼저 유사한 질문이 있었는지 검색해보세요
예시문제 작업형3(신 버전) 2번, 6회 기출유형(작업형3) Q2-1을 보면서, formula 값을 언제 지정해야하는지 궁금하여 질문드립니다.
<예시문제 작업형3(신 버전) 2번>
Gender, SibSp, Parch, Fare를 독립변수로 사용하여 로지스틱 회귀모형을 실시하였을 때, Parch 변수의 계수값은? (반올림하여 소수 셋째 자리까지 계산)
#2.
print(df[['Gender', 'SibSp', 'Parch', 'Fare']].head(3))
from statsmodels.formula.api import logit
model = logit("Survived ~ C(Gender) + SibSp + Parch + Fare", data=df).fit()
print(model.summary())
print(round(-0.2007,3))
# -0.201
여기에는 formula를 따로 정의하지 않았고,
<6회 기출유형(작업형3) Q2-1>
다중 선형 회귀 모델을 구축하고, 독립변수 o3의 회귀계수를 구하시오.
독립변수: solar(태양 에너지), wind(바람의 세기), o3(오존 농도)
종속변수: temperature(온도)
from statsmodels.formula.api import ols
formula = "temperature ~ solar + wind + o3"
model = ols(formula, data=df).fit()
print(model.summary())
# 0.0749
model.params['o3']
여기에서는 formula를 정의하였습니다.
ㅠㅠ 둘이 뭔 차이길래 그런지 잘 모르겠습니다.
답변 1
0
작성한 fomula는 변수이고, 변수 사용하고 안하고 차이입니다.
조건을 작성할때 cond 사용하는 것과 같아요
cond = df['a'] > 4
df[cond]와
df[df['a']>4] 처럼 말이죠!
아... 제가 시험 다가오면서 너무 긴장한 것 같네요 ㅠㅠ 친절한 답변 감사합니다.