인프런 커뮤니티 질문&답변

현지원님의 프로필 이미지

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

모델링 및 평가(회귀)

로그 스케일 질문

해결된 질문

24.06.16 14:38 작성

·

108

0

안녕하세요 🙂

 

MinMax, Standard 스케일링은 train, test 다 적용해줬는데

로그 스케일을 진행할 때는 train 데이터에만 적용해야 하는건가요?

스크린샷 2024-06-16 오후 2.36.40.png

답변 2

0

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

2024. 06. 16. 22:09

로그스케일을 적용한 charges은 타겟입니다.

타켓은 test에는 없습니다.

로그스케일은 적용하고, 예측후에 다시 복원까지 필요한 복잡한 단계가 있어요

혹시 작업형2을 이제 학습중이라면 로그스케일은 패스해주세요! 심화 내용입니다.

 

0

인프런 AI 인턴님의 프로필 이미지

2024. 06. 16. 14:41

안녕하세요, 인프런 AI 인턴입니다. 현지원님의 질문에 대해 특정 강의 내용을 기반으로 한 답변이 있어 해당 내용을 공유드리겠습니다.

로그 스케일링 및 다른 스케일링 방식들을 적용하는 방법과 타깃 변수에만 로그 변환을 적용하는 것의 적절성에 대한 구체적인 답변은 “3-6 Regression 강의 관련 질문”에서 확인하실 수 있습니다. 이 답변에서는 로그 스케일링을 특정 컬럼(예: charges)에만 적용하는 이유와 전체 컬럼에 적용하지 않는 경우의 배경에 대해 설명하고 있습니다.

로그 스케일의 주요 목적은 데이터의 분포가 크게 왜곡되어 있거나 예측의 정확도를 향상시키기 위해 사용됩니다. 특히, 타겟 변수에 로그 변환을 적용하는 경우는 예측 모델의 성능을 개선하기 위해 자주 사용되는 전략 중 하나입니다. 로그 변환 후, 모델 예측값에는 역변환 과정이 필요할 수 있는데, 이 과정 역시 해당 답변에서 다뤄지고 있습니다.
질문에서 언급된 것처럼, 로그 변환을 타겟 변수에만 적용하는 이유는 적용 예시와 같이 해당 변수의 분포가 불균형하거나 예측에 있어서 보다 선형적인 관계를 형성하기 위함입니다. 그러나 이 변환을 적용한 후 모델 학습에 사용된다면, 예측 결과를 해석할 때 역변환 과정을 통해 원래 스케일로 돌리는 과정이 추가적으로 필요함을 유념해야 합니다.

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.