인프런 커뮤니티 질문&답변

문환룡님의 프로필 이미지
문환룡

작성한 질문수

처음하는 딥러닝과 파이토치(Pytorch) 부트캠프 (쉽게! 기본부터 챗GPT 핵심 트랜스포머까지) [데이터분석/과학 Part4]

딥러닝으로 Regression 문제 적용해보기 (House Price Kaggle 문제)

딥러닝으로 Regression 문제 적용해보기 (House Price Kaggle 문제) 질문입니다

작성

·

343

0

해당 강의 11:25 에서

standardScaler()를 X_train과 X_test에 적용을 시키는데 결과값인 y_train에는 결국 SalePrice를 구하기위해서 standardScaler()를 적용시키지 않는다고 이해를 했습니다.

여기서 질문이, 그럼 standardScaler()는 주로 input 데이터들(ex - X_train과 X_test 등) 에만 적용을 시키고 결과값(y_train 등)에는 적용을 잘 안시키나요?

답변 1

0

안녕하세요. 답변도우미입니다.

standardScale 은 feature 들의 스케일이 너무 달라서, 특정 feature 의 영향이 과하게 또는 너무 적게 반영이 되는 케이스가 있어서, cost 값이 발산하는등 정상적인 학습이 어려울 경우에 보통 적용을 합니다. 그래서 입력(feature) 데이터에 대해서 일반적으로 많이 하고요.

최종적으로 예측해야 하는 결과값인 y_train 에 scaling을 하게 되면, 결과값이 결국 변경이 되는 것이라서, 결과값 예측이 아예 잘못될 수 있어서 결과값까지 scaling 하지는 않는 것이 일반적입니다. 또는 scaling 을 했더라도, 다시 이를 기존 결과값 scaling 으로 변환해야 결과값에 유사한 값을 얻을 수 있습니다.

감사합니다.

문환룡님의 프로필 이미지
문환룡

작성한 질문수

질문하기