작성
·
343
0
해당 강의 11:25 에서
standardScaler()를 X_train과 X_test에 적용을 시키는데 결과값인 y_train에는 결국 SalePrice를 구하기위해서 standardScaler()를 적용시키지 않는다고 이해를 했습니다.
여기서 질문이, 그럼 standardScaler()는 주로 input 데이터들(ex - X_train과 X_test 등) 에만 적용을 시키고 결과값(y_train 등)에는 적용을 잘 안시키나요?
답변 1
0
안녕하세요. 답변도우미입니다.
standardScale 은 feature 들의 스케일이 너무 달라서, 특정 feature 의 영향이 과하게 또는 너무 적게 반영이 되는 케이스가 있어서, cost 값이 발산하는등 정상적인 학습이 어려울 경우에 보통 적용을 합니다. 그래서 입력(feature) 데이터에 대해서 일반적으로 많이 하고요.
최종적으로 예측해야 하는 결과값인 y_train 에 scaling을 하게 되면, 결과값이 결국 변경이 되는 것이라서, 결과값 예측이 아예 잘못될 수 있어서 결과값까지 scaling 하지는 않는 것이 일반적입니다. 또는 scaling 을 했더라도, 다시 이를 기존 결과값 scaling 으로 변환해야 결과값에 유사한 값을 얻을 수 있습니다.
감사합니다.