작성
·
37
0
ㅅ선생님 이전 8회 실기준비할 때 보면
대부분 원-핫 인코딩으로 하는 분위기였는데
이번에도 그렇게 준비해도 충분 하겠죠?
뭐랄까 Label Encoder는 실전에서 코드가 생각 잘 안나기도 하고 그래서요 ㅠㅠ
타겟값 옮겨겨놓기
target = train.pop('total')
# 원핫 인코딩
train = pd.get_dummies(train)
test = pd.get_dummies(test)
# 데이터 분할을 해보자
from sklearn.model_selection import train_test_split
X_tr, X_val, y_tr, y_val = train_test_split(train, target, test_size=0.2, random_state=0)
# 랜포에 넣어보자
from sklearn.ensemble import RandomForestRegressor
rf = RandomForestRegresosr(random_state=0)
rf.fit(X_tr, y_tr)
pred = rf.predict(X_val)
# 제출 해보자
pred = rf.predict(test)
submit = pd.DataFrame({'pred': pred})
이렇게만 해서 40점은 받긴 했는데... (저번에 1유형 0점맞아서 재수 중..ㅠㅠ)
submit.to_csv("result.csv", Index=False)
넵 인코딩은 크게 문제 없는거 같고
루틴대로 잘 해야겠어요 ㅠㅠ
선생님 그나저나 해설강의중에 1-3 오즈비 구하는 강의는 생략된걸가요?