20.11.10 11:51 작성
·
541
0
안녕하세요 선생님. 항상 좋은 수업 잘 듣고 있습니다 :)
다름이 아니라 "로그 변환" 관련 질문 사항이 있어서 글을 올리게 되었습니다.
선형 모델의 경우, 타겟 변수 뿐만 아니라 input 변수(X)도 마찬가지로 치우친 분포를 보인다면, 정규 분포 형태에 가깝게 만들어 주는 과정이 필요한 것으로 알고 있습니다.
그렇다면 제가 만약 2018~2019년도의 데이터(train)를 통해 2020년도 특정 월의 데이터(test )를 예측하는 경우에 2018~2019년도 데이터 셋(train)에서 input 변수들에 대해서 로그 변환을 수행해줬다면, 마찬가지로 2020년도 데이터 셋(test)의 input 변수들에도 동일하게 로그 변환을 수행해주어야 하나요?
즉, train set의 연속형 input 변수들(features)에 로그 변환을 해주었다면, test set의 연속형 input 변수들(features)에도 똑같이 로그 변환 처리를 해줘야 하는지 궁금합니다.