인프런 커뮤니티 질문&답변

빅분기님의 프로필 이미지
빅분기

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

6회 기출유형 (작업형2) 🆕 updated 2023.9

test에서 결측치가 발생할 경우

해결된 질문

작성

·

202

·

수정됨

0

  • 학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!

  • 질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요

  • 먼저 유사한 질문이 있었는지 검색해보세요

질문 : test에서 결측치가 발생할 경우엔 행을 삭제 못하나요?

 

test 파일의 경우 저희가 시험장에서 볼 수 있는 것은 X_test 파일이고, y_test는 저희가 볼 수 없는 파일이잖아요. 그럼 X_test의 행을 삭제하면 오류가 뜨나요? 예를 들어 X_test에서 행이 50개인데 행을 3개 삭제하면, y_test는 50개이니까 평가가 불가능하지 않을까 싶습니다. 즉, test에는 결측치가 발생하면 X_test.fillna()를 통해 대체를 할 수 있지, X_test.dropna()처럼 행을 삭제할 수 없나요?

 

강의 때 올려주신 예시문제나 기출문제 해설을 봐도 작업형2에는 모두 결측치가 없어서, 이렇게 질문으로 올립니다.

 

시험이 다가오니 사소해 보이는 질문도 확인을 받고 싶네요 ㅠㅠ 항상 감사합니다

답변 1

0

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

네, 아직 결측치가 나온적이 없습니다.

test의 행을 삭제하면 오류가 뜨나요? -> 아니요 그래서 조심해야 합니다. 오류는 나지 않고 제출 시 0점 처리 됩니다.

test는 절대로 행을 삭제하면 안 됩니다.

대체값을 대입하거나 결측값이 50%이상 넘어가는 컬럼이라면 train과 test동일하게 컬럼 삭제는 가능합니다.

빅분기님의 프로필 이미지
빅분기

작성한 질문수

질문하기