해결된 질문
작성
·
236
·
수정됨
0
섹션 11. 예시문제 작업형 2유형에서 질문드립니다
train.val 데이터셋 구분할 때 이미 cols 을 적용해서
x_tr,x_val,y_tr,y_val = train_test_split(train[cols], target, test_size = 0.15, random_state= 2023)
이런식으로 구분을 했는데
model에 적용할때도 꼭 cols 컬럼을 지정해줘야하나요?
model.fit(X_tr,y_tr)
pred = model.predict_proba(X_val)
이렇게만 적으면 안되나요?
수치형데이터에서는 cols 컬럼을 지정해서 model.fit 을 했는데
문자형 데이터에서는 또 cols 컬럼을 지정하지 않았는데
다르게 데이터를 넣는 이유가 있을까요?
선생님 궁금한게 있는데 그럼 혹시 두개 결과값(pred) 다를까요?
model.fit(X_tr[cols],y_tr)
pred = model.predict_proba(X_val[cols])
model.fit(X_tr,y_tr)
pred = model.predict_proba(X_val)