해결된 질문
작성
·
187
0
train_test_split한 다음에 랜덤포레스트 모델학습에서 아래와 같이 코드 설명해주셨는데요.
model.fit(X_tr[cols], y_tr)
pred = model.predict_proba(X_val[cols])
train_test_split에서 이미 train[cols]로 train 범위가 한정되었는데 모델학습에서 X_tr과 X_val를 [cols]로 또 한정해줘야 할까요?
저는 아래와 같이 모델학습에서 [cols]를 빼고 코드를 작성했는데 오류는 나지 않지만 강의와 결과값이 조금 다릅니다.
from sklearn.model_selection import train_test_split
X_tr, X_val, y_tr, y_val = train_test_split(train[cols], target, test_size=0.2, random_state=0)
# 모델학습
from sklearn.ensemble import RandomForestClassifier
model = RandomForestClassifier(random_state=2023)
model.fit(X_tr, y_tr)
pred = model.predict_proba(X_val)