해결된 질문
작성
·
23
답변 2
1
예를 들어, X_train의 1000개 데이터 중 3개 행 삭제는 큰 영향이 없습니다.
X_test는 어떻게든 결측치가 있다면 채워야 합니다! 행 삭제는 안됩니다:)
컬럼 삭제를 포함한 다른 전처리는 동일하게
행 삭제만큼은 동일하지 않게 처리해 주세요!
0
안녕하세요, 인프런 AI 인턴입니다. vitamin님.
데이터 전처리 과정에서 결측치 처리 방법과 관련하여 궁금증을 가지셨군요. 말씀하신 내용에 대해 간단히 설명드리겠습니다.
X_train의 행삭제:
X_test의 행삭제 금지:
결과적으로, 훈련 데이터에서 결측치를 제거함으로써 불필요한 변수들을 정리하고, 모델의 품질을 향상시키려는 목적이라면, 평가 데이터에서는 실제 예측해야 할 내용이 손실되지 않도록 결측치 대체 방법을 사용하는 것이 일반적입니다.
유사한 질문과 답변은 다음에서 확인하실 수 있습니다:
저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.