인프런 커뮤니티 질문&답변

jaeycobb님의 프로필 이미지
jaeycobb

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

다중선형회귀2 (범주형 변수) 🆕 updated 2023.9

formula.api logit 범주형변수

해결된 질문

작성

·

212

0

안녕하세요.
로지스트회귀분석 formula.api 에서 logit 을 사용할 때,
예를들어 성별 F, M 을 C()로 묶어주면 여자성별은 사라지는데,

 

1.여기서 다른 변수들은 고정되어있고, 여성에 비해 남성의 오즈비를 구하려면 어떻게 해야하나요?

2. 예측값을 넣을때

model.predict() 를 사용하라고 배웠습니다. 안에는 새로운 데이터를 넣고, 근데 이 새로운 데이터를 기존 주어진 데이터 프레임의 한 행에서 가져와서 넣고, 예측확률을 구하는 것은 어떻게 하나요?

답변 1

1

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

  • 남성(M)에 대한 계수를 지수화 하면 exp(계수)구할 수 있습니다.

  • 아래와 같이 새로운 데이터로 예측할 수 있어요

new = pd.DataFrame([기존 데이터 프레임의 한 행])
model.predict(X_new)


new_data= pd.DataFrame({'몸무게':[67]})
result = model.predict(new_data)


jaeycobb님의 프로필 이미지
jaeycobb
질문자

감사합니다..!

결국 강의 내용과 동일하네요. 문제 해석이 안되었던거였군요.

해결되었습니다~

jaeycobb님의 프로필 이미지
jaeycobb

작성한 질문수

질문하기