해결된 질문
작성
·
666
·
수정됨
0
원핫 인코딩 후 출력값이 True/False로 나오는데 1,0으로 나오는 것과 같은 건가요? 무시하고 계속 진행해도 괜찮은건지 궁금합니다!!!
import pandas as pd
test = pd.read_csv("/kaggle/input/dataset/test.csv")
train = pd.read_csv("/kaggle/input/dataset/train.csv")
c_train = train.select_dtypes(include='O').copy()
n_train = train.select_dtypes(exclude='O').copy()
c_test = test.select_dtypes(include='O').copy()
n_test = test.select_dtypes(exclude='O').copy()
c_train = pd.get_dummies(c_train)
c_test = pd.get_dummies(c_test)
c_train.head()
답변 1
0
네, 문제 없을 것 같아요!
그리고 오브젝트를 분리하지 않고 train을 그대로 pd.get_dummies에 넣으면
알아서 범주형 데이터만 원핫인코딩 하고 수치형은 그대로 둡니다. 참고해주세요!!
pd.get_dummies(train)
감사합니다 :)