인프런 커뮤니티 질문&답변

이승재님의 프로필 이미지
이승재

작성한 질문수

[개정판] 파이썬 머신러닝 완벽 가이드

신용카드 사기 예측 실습 이상치 실습 질문

해결된 질문

작성

·

273

1

이상치 제거 할때 train set에서만 이상치를 제거해야 되지 않나요? 실습때는 train, test를 나누기 전에 이상치를 먼저 제거해서 test set에서도 제거 되는것 같습니다.

답변 1

1

권 철민님의 프로필 이미지
권 철민
지식공유자

안녕하십니까,

네, 맞습니다 Test 데이터 세트에서 제거 하셔도 됩니다.

다만 이상치 제거시 생각해볼 사항이 있습니다.

실제 예측에 사용되는 데이터가 이상치를 포함한 데이터가 사용될수도 있습니다.

그러니까 학습 데이터와는 달리 예측(즉 test 데이터)에 사용되는 데이터는 이상치가 포함될 수 있는 상황이라면 test 데이터의 이상치를 삭제하지 않고 예측 성능을 측정하는 것이 좋습니다.

감사합니다.

이승재님의 프로필 이미지
이승재

작성한 질문수

질문하기