인프런 커뮤니티 질문&답변

munjihey1127님의 프로필 이미지
munjihey1127

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

작업형2 모의문제1

작업형2 범주형 데이터 처리시

해결된 질문

작성

·

215

0

from sklearn.preprocessing import LabelEncoder

cols = ['Gender','Education_Level','Marital_Status','Income_Category','Card_Category']

 

이렇게 하나하나 다 적는방법도 잇지만

cols=train.select_dtypes(include="O").columns

이렇게도 가능하다고 하셧는데

만약 이렇게하면

다른 네임명으로 받으면서 test도 따로 해줘야하나요

cols2=test.select_dtypes(include="O").columns

이렇게요?

답변 2

0

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

머신러닝에 넣을 데이터의 컬럼은 train과 test가 결국은 동일해야 합니다.

train과 test를 따로 뽑는 것은 나중에 오류를 일으킬 수 있어요

train에서 target값만 미리 제외하고 함께 cols를 사용해주세요!

0

라벨링 작업시에는 train과 test 칼럼이 동일할거라 따로 안해줘도 되요!

munjihey1127님의 프로필 이미지
munjihey1127

작성한 질문수

질문하기