문제 2번 의사결정나무 오류

0

퇴근후딴짓

지식공유자

빈칸에 작성하셨죠? 초보자가 오류를 찾기 어려울 것 같아요

제가 공유한 두 노트북 중 코드가 작성된 노트북을 열고

한 셀씩 복사 붙여넣기(덮어쓰기) 하면서 오류가 난 부분을 찾아보면 어떨까요?

연뚜

질문자

네 빈칸에 작성했습니다..! 다시 복습해서 들어볼게요 감사합니다 ㅠㅠ

0

퇴근후딴짓

지식공유자

X_train에 결측치가 있습니다.

런타임 - 모두 실행을 통해 다시 한번 실행해 주시고

에러가 난다면 전처리 부분 보여주실 수 있을까요?

0

인프런 AI 인턴

안녕하세요, 인프런 AI 인턴입니다.

연수이 님께서 직면하고 계신 “문제 2번 의사결정나무 오류”와 관련하여 예측 과정에서 발생하는 ValueError: Input X contains NaN 문제는 의사결정나무 모델이 NaN값, 즉 누락된 값으로 학습 또는 예측을 수행할 수 없다는 것을 알려주는 오류 메시지입니다. 이러한 문제는 데이터 전처리 단계에서 결측치(NaN)를 처리하지 않아 발생할 수 있습니다. 결측치 처리 방법으로는 결측치를 특정 값으로 채우거나(such as 0, 평균값, 중앙값 등), 결측치를 포함하는 행이나 열을 제거하는 방법이 있습니다.

DecisionTreeClassifier와 같은 모델을 사용하기 전에는 반드시 데이터셋에서 결측치 처리를 완료해야 합니다. 이는 모델 학습 및 예측의 정확도에 중요한 영향을 미칩니다.

이와 유사한 문제로 질문을 주셨던 다른 분들의 사례를 참고하시면 도움이 될 수 있습니다:

데이터 분리 후 의사결정나무 실행 시 오류: 이 문제는 의사결정나무 모델을 실행하려고 할 때 발생하는 ValueError와 유사합니다. 문제의 원인은 의사결정나무 모델의 인스턴스를 생성할 때 DecisionTreeClassifier 뒤에 소괄호가 빠진 오타였지만, 결측치 문제도 유사한 주의가 필요합니다. (데이터 분리 후 의사결정나무 실행 시 오류)

데이터에 결측치가 있는지 확인하고, 있다면 pandas의 fillna() 함수를 사용하여 채우거나 dropna() 함수를 사용하여 제거할 수 있습니다. 예를 들어, 모든 결측치를 0으로 채우려면 X_train.fillna(0, inplace=True)와 같이 코딩할 수 있습니다.

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

인프런 커뮤니티 질문&답변