해결된 질문
작성
·
105
답변 2
0
데이터를 알고 이야기하는 것이 아니라 이상치 부분은 정말 조심스럽습니다.
이상치에 대해 문제에서 언급하지 않는다면 처리하지 않는 것으로 하시죠!!
만약 시험 환경에서 age 데이터가 주어지고 - 값이 있는 것을 확인했다면,
이 가정을 저에게 준다면
시험이다보니 일단 그냥 두겠습니다. 입문자가 이상치 처리하려다 실수할 가능성이 너무 올라갑니다.
그렇지만 이상치 처리를 굳이 하고 싶다면 train에 -가 있고, test에도 -가 있는지 확인 하겠어요! 만약 test에도 -가 있다면 이건 이유가 있는 데이터 입니다. 그대로 둡니다.
train -가 있고, test -가 없다면 ... 도전해볼만해요!
그렇지만 그 데이터가 소수가 아니라 많다면 또 고민할 것 같아요 시험에서 주어지는 데이터가 많은 데이터는 아니어서요!
결론은 문제에서 언급하지 않으면 그냥 두시죠!!
0