인프런 커뮤니티 질문&답변

sun785님의 프로필 이미지
sun785

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

3회 기출유형(작업형2)

범주형, 수치형 데이터 분리해서 전처리

해결된 질문

작성

·

452

0

범주형, 수치형 컬럼을 각각 train, test 나눠서

수치형은 MinMaxscaler

범주형은 LabelEncoder 이런식으로 진행을하고

나중에 pd.concat으로 합쳐주는 과정을 거치다보면

특히 합치는 과정에서 오류를 많이 내고 있는 상황인데요

 

type2-ex처럼

범주형 '주구매상품', '주구매지점' 컬럼을 각각 라벨 인코딩해주고

나머지 cols에 수치형 모아서 인코딩하는 방식으로 따로 데이터 분리했다가 결합하는 과정 없이 진행해도 무방한가요?

 

답변 1

0

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

네 좋습니다. 기출 3회만 분할하는 것을 보여주고 있어요!
데이터 분할 없이 데이터를 선택(cols)로 진행해도 됩니다.

다양한 전처리 방법이 있습니다 :)

sun785님의 프로필 이미지
sun785

작성한 질문수

질문하기