인프런 커뮤니티 질문&답변

화이팅님의 프로필 이미지
화이팅

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

작업형2 모의문제1

스케일링 질문입니다.

해결된 질문

작성

·

113

0

  • 학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!

  • 질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요

  • 먼저 유사한 질문이 있었는지 검색해보세요

스케일링 진행 시 train 에는 있지만 test 에 컬럼이 없는 경우

"None of [Index(['Attrition_Flag'], dtype='object')] are in the [columns]"

의 오류가 발생합니다.

컬럼 리스트의 기준을 train으로 잡지 않고

중복되는 컬럼만 존재하는 test의 기준으로 컬럼 리스트를 잡고

fit_transform 을 진행해주어도 상관이 없을까요?

from sklearn.preprocessing import RobustScaler
rols = test.select_dtypes(exclude='object').columns
for rol in rols:
  rs = RobustScaler()
  train[rol] = rs.fit_transform(train[[rol]])
  test[rol] =rs.transform(test[[rol]])

작성한 코드입니다.

 

답변 1

0

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

스케일링전에 target컬럼은 별도로 저장해주시죠!! target컬럼 때문입니다.

target = train.pop('Attrition_Flag')

화이팅님의 프로필 이미지
화이팅

작성한 질문수

질문하기