작성한 질문수
[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
7회 기출유형(작업형1) 🆕 updated 2024.4
해결된 질문
작성
·
135
1
이상치에 민감하지 않도록 Rubust scaler 사용하실 때는
scaler = Rubustscaler()
하시고, scaler.fit_trasnform(train)
scaler.transform(test) 하셨던 걸로 기억하는데
왜 여기서는 scaler.fit_transform(df[['socre']])로 진행하신 걸까요?
답변 1
0
사이킷런에서 제공하는 스케일은 대부분 데이프프레임을 입력으로 받고 있어요!
train도 test도 데이터 프레임입니다.
df['socre'] -> 시리즈
df[['socre']] -> 데이터프레임
일반적으로
cols = ['컬럼명']
df[cols]도 정확하게는 df[['컬럼명']]과 같아요! 따라서 데이터프레임입니다.
아 ! 데이터 프레임인 줄은 알고 있으나, train은 컬럼명 지정이 아닌 train 데이터 전체를 사용하신 게 아녔었나용??
아 ! 데이터 프레임인 줄은 알고 있으나, train은 컬럼명 지정이 아닌 train 데이터 전체를 사용하신 게 아녔었나용??