인프런 커뮤니티 질문&답변

김유진님의 프로필 이미지
김유진

작성한 질문수

[파이토치] 실전 인공지능으로 이어지는 딥러닝 - 기초부터 논문 구현까지

데이터 불균형(Data Imbalance)

데이터 불균형

해결된 질문

작성

·

250

1

- 학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!
- 먼저 유사한 질문이 있었는지 검색해보세요.
- 서로 예의를 지키며 존중하는 문화를 만들어가요.
- 잠깐! 인프런 서비스 운영 관련 문의는 1:1 문의하기를 이용해주세요.

 

안녕하세요. 데이터 불균형 수업 관련하여 질문드립니다.

 

수업중에 알려주신 예시는 classification 문제에서의 데이터 불균형 해결 방법을 알려주셨는데요,

혹시 regression 문제에서도 데이터 불균형 해결이 필요한것이 맞을까요? (예를들어 신장(키) 학습 시 평균 키를 가지는 샘플이 많은 경우)

 

regression 문제에서 데이터 불균형이 있을 경우, 어떤 방법으로 해결할 수 있을지 궁금합니다!

감사합니다.

답변 1

0

딥러닝호형님의 프로필 이미지
딥러닝호형
지식공유자

안녕하세요.

말씀하신 회귀 문제에서의 불균형은 타겟 데이터의 불균형 분포를 말씀하시는 것이지요?

이에 대해 이상치 제거, 샘플링 기법(SMOGN 등)을 사용할 수 있습니다.

기본적으로 편향되지 않게 학습되는 것을 방지하는 것이 목표이기 때문에 이미 성능이 검증 된 앙상블 기법(XGboost 등)을 사용해도 됩니다.

데이터에 맞는 다양한 방법을 비교해 보시면 될 것 같습니다!

 

감사합니다.

 

김유진님의 프로필 이미지
김유진

작성한 질문수

질문하기