해결된 질문
작성
·
161
0
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!
질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요
먼저 유사한 질문이 있었는지 검색해보세요
train.describe()를 찍어봤을 때, 총구매액과 최대구매액의 최솟값이 음수로 나오던데 이 부분은 전처리 하지 않아도 큰 문제는 없을까요? 음수인 값을 0으로만 바꿔줬더니 0.67로 성능이 조금 더 좋아지긴 하더라고요..!
그냥 원본데이터 그대로 제출하는 것이 좋을지, 이 부분도 음수인 값들만 처리해준 다음에 성능만 높아진다면 처리하는 게 좋을지 궁금합니다.
좋은 수업 감사합니다!
답변 1
0
train에도 음수가 있고 test에도 음수가 있어요!
삭제하지 않는 것을 추천합니다. 우리는 커머스 도메인을 잘 알지 못하고 이상치가 아니라 환불 등의 이유가 있을 수 있어요
성능이 좋아진 이유가 검정데이터에 음수가 없어서 일 수도 있습니다.