해결된 질문
작성
·
254
0
작업형2문제를 풀때
eda 후 전처리&피처엔지니어링 단계에서
범주형자료들을 무조건 라벨인코딩만 하려고 합니다
((원핫인코딩과 라벨인코딩 둘다 실행시켜서 비교안할거임)
라벨인코딩만 하려는 상황에서도
train_test_split 을 사용해야 하는지
아니면 그냥 바로 랜덤포레스트를 돌려도 되는지 궁금합니다
작업형2 모의문제1 풀이를 적으면서 보는중인데
만약 train_test_split 을 사용안하면
랜덤포레스트 돌릴때
model(X_tr,y_tr)
pred =model.predict(X-val)
이자리에 뭘 넣어야 할지 궁금합니다
+train_test_split 을 사용하면 좋은 점수를 받는지도 궁금합니다
+작업형2 모의문제1 풀이에서 강사님이 처음에 drop의 방식을 하셨는데 drop방식보단 라벨인코딩이 더 좋은점수를 받을수 있는 풀이방법인지도 궁금합니다
항상 감사합니다 !