해결된 질문
작성
·
312
0
안녕하세요 강사님
타이타닉 작업형2 코드를 작성하던 중 발생한 오류는 아래와 같습니다.
즉, X_train 컬럼 수와 X_test 컬럼 수가 달라 발생한 문제라고 인지하였습니다.
이를 해결하기 위해 강사님 코드를 참고하여 다른 점은 원핫 인코딩 대상 컬럼에 차이가 있었습니다.
저는 원핫 인코딩을 아래와 같이 작성하였으나,'Ticket', 'Cabin', 'Embarked' 컬럼을 지우니 문제가 해결되었습니다.
'Ticket', 'Cabin', 'Embarked' 컬럼은 범주형 변수인데 원핫인코딩을 하지않고 넘어가는 이유와 위의 변수를 포함하여 원핫인코딩 했을 때 어떠한 이유로 오류가 발생하는지 질문드립니다..
매번 친절히 답변해주셔서 감사합니다.
답변 1
0
7XX 와 2XX로 다른 것을 봐서는 test와 train 범주형 데이터가 많이 다른 것 같아요!
추가한 컬럼을 value_counts()로 확인해보시죠!!
train과 test 합쳐서 인코딩 진행하면 문제가 없습니다.