인프런 커뮤니티 질문&답변

dm1517님의 프로필 이미지
dm1517

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

로지스틱 회귀분석

해결된 질문

작성

·

434

0

1.강의가 많아서 로지스틱 회귀분석 부분을 못 찾겠습니다

어느 부분을 봐야할까요?

 

2작업형3 예시 문제 해설에서 로지스틱 회귀분석이 '분류'모델이라고 하셨는데

회귀분석에 분류와는 어떻게 다른지 궁금합니다..

 

3갑자기 C로 변수를 묶는것도 이해가 안되는데 언제 묶는건지 궁금합니다.

.. 분산분석에서만 C로 묶는것인지, 로지스틱에서도 쓰는건지요.

 

 

답변 1

0

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

1 현재 기준 섹션11. 예시문제 작업형3(신버전)을 확인해 주세요

2 회귀와 분류라고 생각해주세요. 로지스틱 회귀는 이름만 회귀가 들어가있지 분류모델입니다. 로지스틱회귀는 시그모이드라는 함수를 사용하고, 일반적으로 0과 1 사이의 확률값으로 표현되며, 이를 기반으로 특정 임계값을 넘으면 한 범주로, 넘지 못하면 다른 범주로 분류합니다. 결국 0과 1이 출력됩니다.

3 작업형2를 예를 들어 모델을 만들 때 범주형 변수가있다면 인코딩처리를 했었어요!

작업형3에서 사용하는 ols(회귀), logit(로지스틱회귀)는 범주형 변수가 있다면 자동으로 이를 (원핫인코딩)처리 해줍니다. 하지만 여전히 숫자일 인 범주형 변수 그러니깐 1등급, 2등급으로 작성된 것이 아니라 1, 2로 장성된 변수는 별도 범주형 변수로 인식시켜줘야 해요

이때 C()를 사용합니다.

분산분석에서는 독립변수가 범주형 변수이니 숫자만 C()로 묶어도 되고, 습관적으로 독립변수 모두를 각각 C()로 묶어도 됩니다.

 

그 동안 작업형2에서는 범주형 변수가 숫자더라도 그냥 나뒀습니다. 레이블 인코딩과 별반 다를 것이 없어서요! 그런데 작업형3은 p값 등의 정답이 있는 문제여서 정확하게 처리할 필요가 있어요

 

dm1517님의 프로필 이미지
dm1517

작성한 질문수

질문하기