해결된 질문
작성
·
166
·
수정됨
0
안녕하세요, 작업형2 관련 질문드립니다.
시간이 부족해서 train_test_split은 생략, 랜덤포레스트만 사용하려고합니다! ㅜ
문제에 roc_auc 가 나오면 분류, predict_proba로 예측,
나머지는(회귀,분류 모두) 다 pred로 예측
으로 이해했는데 맞을까요?
검증데이터 분류 없이 진행할 때, 아래와 같이 넣으려고 합니다. 맞는지 확인 부탁드립니다 :)
target = train.pop('타겟 컬럼명') 진행 후,
데이터 전처리 시, 스케일링을 진행하지 않는다면 오류가 생기는 경우도 있을까요?
문제 없다면 object컬럼 drop, 결측치 처리만 진행하려 합니다!
짧은 시간에 강의로 많은 도움 얻었습니다! 답변도 미리 감사드립니다 !!
답변 1
0
pred로 예측하는 것은 아니며, predict입니다.
네 맞습니다.
스케일링을 진행하지 않아도 됩니다.
인코딩은 연습하는 것을 추천해요!!! 만약 거의다 범주형 데이터인 데이터가 나오면 다 버릴 순 없고, 또 40점에 대한 기준이 올라가고 있어서 인코딩 별도 영상을 참고해서 연습해가는 것을 추천합니다.