인프런 커뮤니티 질문&답변

필주님의 프로필 이미지
필주

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

평가지표 (이진/다중 분류, 회귀) 🆕 updated 2023.10

스케일링 질문드립니다.

해결된 질문

작성

·

125

0

n_train = train.select_dtypes(exclude='object').copy()

n_test = train.select_dtypes(exclude='object').copy()

보통 민맥스 스케일링 할 때 위처럼 오브젝트와 아닌 것들을 나눈 뒤에 아래 처럼 스케일링을 진행하잖아요.

 

근데 밑에서 cols 변수에 수치형 데이터만 명시를 하는데

굳이 나눠서 하는 이유가 뭔가요??

그냥 train[cols] 로 해도 전혀 문제 없는 거 아닌가요?

 

cols = ['컬럼명', '컬럼명', '컬럼명']

from sklearn.preprocessing import MinMaxScaler

scaler = MinMaxScaler()

n_train[cols] = scaler.fit_trainsform(n_train[cols])

n_test[cols] = scaler.trainsform(n_test[cols])

답변 1

0

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

네 나눠서 하지 않아도 됩니다.

아래처럼 진행해주세요 🙂

 

시험 잘 보고 오세요!!

필주님의 프로필 이미지
필주

작성한 질문수

질문하기