해결된 질문
작성
·
102
0
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!
질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요
먼저 유사한 질문이 있었는지 검색해보세요
안녕하세요 작업형 2 한 가지 방법으로 풀기를 봤는데요
지금까지는 결측치나 이상치가 없었던 것으로 알고있는데요
1.만약 8회차에 결측치나 이상치가 존재한다면
여기서 EDA이후 결측치나 이상치를 제거하고 인코딩으로 넘어가면 되는거죠??
2.그리고 영상에서는 target빼고 원핫 인코딩으로 다 진행 하던데 혹시나 조금 더 꼼꼼하게 진행할려면
target데이터 제외후 범주형은 원핫 인코딩 수치형은 스케일링 돌린후
검증 데이터 나누고 randforest로 학습 및 평가 후 제출 하면 되는 걸 까요??
답변 1
0
이상치라고 문제에서 말하지 않으면 그냥 넘어가시죠! 어설프게 작업하다가 잘못 제거해서 0점처리될까봐 걱정됩니다. 결측치는 채우거나 제거할 수는 있지만 test데이터의 행은 절대 제거하면 안됩니다.(컬럼은 상관없음)
꼼꼼히 진행하려면
전처리 하나를 추가할 때마다 성능을 보고 기록해두면서 비교해나가면 됩니다.