인프런 커뮤니티 질문&답변

이명주님의 프로필 이미지
이명주

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

4회 기출 유형(작업형2)

원핫인코딩 출력값 True, False

해결된 질문

작성

·

668

·

수정됨

0

원핫 인코딩 후 출력값이 True/False로 나오는데 1,0으로 나오는 것과 같은 건가요? 무시하고 계속 진행해도 괜찮은건지 궁금합니다!!!

 

import pandas as pd

test = pd.read_csv("/kaggle/input/dataset/test.csv")

train = pd.read_csv("/kaggle/input/dataset/train.csv")

c_train = train.select_dtypes(include='O').copy()

n_train = train.select_dtypes(exclude='O').copy()

c_test = test.select_dtypes(include='O').copy()

n_test = test.select_dtypes(exclude='O').copy()

 

c_train = pd.get_dummies(c_train)

c_test = pd.get_dummies(c_test)

c_train.head()

답변 1

0

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

네, 문제 없을 것 같아요!
그리고 오브젝트를 분리하지 않고 train을 그대로 pd.get_dummies에 넣으면
알아서 범주형 데이터만 원핫인코딩 하고 수치형은 그대로 둡니다. 참고해주세요!!

 

 pd.get_dummies(train)
이명주님의 프로필 이미지
이명주
질문자

감사합니다 :)

이명주님의 프로필 이미지
이명주

작성한 질문수

질문하기