인프런 커뮤니티 질문&답변

yb님의 프로필 이미지

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

실제 시험에서 이상치 발견 시

해결된 질문

작성

·

97

0

만약 시험 환경에서 age 데이터가 주어지고 - 값이 있는 것을 확인했다면,

따로 이상치를 제거하란 말이 없으면 - 값을 그대로 놔둬야 할까요, 아니면 제가 스스로 판단해서 - 값을 제거해주어야할까요?

답변 2

0

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

데이터를 알고 이야기하는 것이 아니라 이상치 부분은 정말 조심스럽습니다.

이상치에 대해 문제에서 언급하지 않는다면 처리하지 않는 것으로 하시죠!!

 

만약 시험 환경에서 age 데이터가 주어지고 - 값이 있는 것을 확인했다면,

이 가정을 저에게 준다면

  1. 시험이다보니 일단 그냥 두겠습니다. 입문자가 이상치 처리하려다 실수할 가능성이 너무 올라갑니다.

  2. 그렇지만 이상치 처리를 굳이 하고 싶다면 train에 -가 있고, test에도 -가 있는지 확인 하겠어요! 만약 test에도 -가 있다면 이건 이유가 있는 데이터 입니다. 그대로 둡니다.

  3. train -가 있고, test -가 없다면 ... 도전해볼만해요!

    그렇지만 그 데이터가 소수가 아니라 많다면 또 고민할 것 같아요 시험에서 주어지는 데이터가 많은 데이터는 아니어서요!

     

     

    결론은 문제에서 언급하지 않으면 그냥 두시죠!!

 

0

저도 궁금합니다!

yb님의 프로필 이미지

작성한 질문수

질문하기