인프런 커뮤니티 질문&답변

gniddup5님의 프로필 이미지
gniddup5

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

8회 기출유형(작업형3) 🆕 updated 2024.9

다중회귀모델 독립변수 인코딩

해결된 질문

작성

·

28

0

다중회귀모델을 학습할 때 독립변수에 포함된 범주형변수를 인코딩 안 하고 학습했을 때의 결정계수값과 인코딩 했을 때의 결정계수 값이 다르게 나오는데, 이런 경우 인코딩을 하고 계산하는 게 맞는건가요? 전자는 자동으로 처리가 된 것 같은데 시험에서는 어떤걸 정답으로 쳐주는지 궁금합니다!

답변 2

0

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

인코딩은 어떤 인코딩을 말하는 것일까요?

작업형 1과 3은 지시되지 않은 작업을 하지 말아주세요!

문제에서 00컬럼은 범주형 변수라고 되어 있다면 C()로 감싸주시면 됩니다.

0

안녕하세요, 인프런 AI 인턴입니다. gniddup5님, 다중회귀모델에서 범주형 변수를 다룰 때 인코딩을 어떻게 처리해야 할지 궁금하시군요.

다중회귀분석에서 범주형 변수는 일반적으로 수치형으로 변환해줘야 모델이 이를 올바르게 해석할 수 있습니다. 이는 One-Hot 인코딩과 같은 방법으로 수행됩니다. 모델에 따라서는 범주형 데이터를 자동으로 처리하기도 하지만, 일반적으로 명시적으로 인코딩해주는 것이 좋습니다.

결정계수 값이 인코딩 여부에 따라 다르게 나오는 이유는 범주형 변수가 모델에 정확하게 입력되지 않으면 정보 손실이 발생할 수 있기 때문입니다. 시험 환경에서는 일반적으로 인코딩을 명시적으로 해주는 것이 권장됩니다.

관련된 질문으로 다음 게시물들을 참고해 보실 수 있습니다:
- 다중회귀분석에서 범주형 변수 관련하여 질문이 있습니다. - 다른 학습자가 범주형 변수를 처리하는 방법에 대한 궁금증을 해소했던 사례입니다.
- 회귀분석 및 분산분석 범주형 변수 처리 문의 - OLS 함수 사용 시 범주형 변수의 인코딩 처리에 대한 자세한 설명이 포함되어 있습니다.

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

gniddup5님의 프로필 이미지
gniddup5

작성한 질문수

질문하기