인프런 커뮤니티 질문&답변

ycann님의 프로필 이미지
ycann

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

5회 기출유형 (작업형2)

원핫인코딩 질문

해결된 질문

작성

·

303

1

5회 기출유형(작업형2)에서 수치형+범주형 활용에서

원-핫 인코딩을 실시하실때 범주형 컬럼을 'cols'에 담아 범주형만 실시해야 되는게 아닌가요?

선생님 코딩에는 전체 컬럼을 대상으로 원-핫 인코딩을 하는 게 아닌가요?

train = pd.get_dummis(train) 가 아닌

cols = [범주형 변수들....]

train[cols] = pd.get_dummis(train[cols]) 가 맞는 게 아닌가요?

답변 1

1

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

ycann님, get_dummies 전과 후를 한번 확인 부탁드려요 :)
판다스 get_dummies는 친절하게도 알아서 인코딩이 필요한 컬럼(피처)만 선택해서 원핫 인코딩을 진행하고 필요없는 수치형 컬럼은 그냥 둡니다. 그래서 전체 데이터를 사용했어요! 👍👍👍

예를들어 수치형 데이터만 가지고 get_dummies를 진행하면 아무일도 일어나지 않습니다:)

본 과정에서 ycann님께서 작성한 질문들의 답변이 되었다면 "해결됨" 체크해주시면 너무 감사하겠습니다 !! 제겐 이전 질문 모두가 미해결로 남아있네요 🙌

ycann님의 프로필 이미지
ycann

작성한 질문수

질문하기