해결된 질문
작성
·
250
1
- 학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!
- 먼저 유사한 질문이 있었는지 검색해보세요.
- 서로 예의를 지키며 존중하는 문화를 만들어가요.
- 잠깐! 인프런 서비스 운영 관련 문의는 1:1 문의하기를 이용해주세요.
안녕하세요. 데이터 불균형 수업 관련하여 질문드립니다.
수업중에 알려주신 예시는 classification 문제에서의 데이터 불균형 해결 방법을 알려주셨는데요,
혹시 regression 문제에서도 데이터 불균형 해결이 필요한것이 맞을까요? (예를들어 신장(키) 학습 시 평균 키를 가지는 샘플이 많은 경우)
regression 문제에서 데이터 불균형이 있을 경우, 어떤 방법으로 해결할 수 있을지 궁금합니다!
감사합니다.
답변 1
0
안녕하세요.
말씀하신 회귀 문제에서의 불균형은 타겟 데이터의 불균형 분포를 말씀하시는 것이지요?
이에 대해 이상치 제거, 샘플링 기법(SMOGN 등)을 사용할 수 있습니다.
기본적으로 편향되지 않게 학습되는 것을 방지하는 것이 목표이기 때문에 이미 성능이 검증 된 앙상블 기법(XGboost 등)을 사용해도 됩니다.
데이터에 맞는 다양한 방법을 비교해 보시면 될 것 같습니다!
감사합니다.