인프런 커뮤니티 질문&답변

Idea님의 프로필 이미지

작성한 질문수

[개정판] 파이썬 머신러닝 완벽 가이드

로그 변환 관련 질문드립니다.

20.11.10 11:51 작성

·

541

0

안녕하세요 선생님. 항상 좋은 수업 잘 듣고 있습니다 :)

다름이 아니라 "로그 변환" 관련 질문 사항이 있어서 글을 올리게 되었습니다.

선형 모델의 경우, 타겟 변수 뿐만 아니라 input 변수(X)도 마찬가지로 치우친 분포를 보인다면, 정규 분포 형태에 가깝게 만들어 주는 과정이 필요한 것으로 알고 있습니다.

그렇다면 제가 만약 2018~2019년도의 데이터(train)를 통해 2020년도 특정 월의 데이터(test )를 예측하는 경우에 2018~2019년도 데이터 셋(train)에서 input 변수들에 대해서 로그 변환을 수행해줬다면, 마찬가지로 2020년도 데이터 셋(test)의 input 변수들에도 동일하게 로그 변환을 수행해주어야 하나요?

즉, train set의 연속형 input 변수들(features)에 로그 변환을 해주었다면, test set의 연속형 input 변수들(features)에도 똑같이 로그 변환 처리를 해줘야 하는지 궁금합니다.

답변 2

1

권 철민님의 프로필 이미지
권 철민
지식공유자

2020. 11. 10. 20:42

안녕하십니까,

네, 맞습니다. 학습 데이터의 피처 변환으로 타겟값을 학습하였다면 테스트 데이터의 피처에도 동일한 변환을 해주셔야 합니다.

감사합니다.

0

Idea님의 프로필 이미지
Idea
질문자

2020. 11. 10. 21:04

답변 감사합니다 :)

Idea님의 프로필 이미지

작성한 질문수

질문하기