해결된 질문
작성
·
111
0
# 검증데이터 분리
from sklearn.model_selection import train_test_split X_tr, y_tr, X_val, y_val = train_test_split(train.drop('TravelInsurance', axis=1), train['TravelInsurance'], test_size=0.2, random_state=2002)
X_tr.shape, y_tr.shape, X_val.shape, y_val.shape
이렇게 한 이후에
# 랜덤포레스트
from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import accuracy_score
model = RandomForestClassifier()
model.fit(X_tr, y_tr)
(밑에 코드는 생략했습니다) 근데 오류가 model.fit(X_tr, y_tr)에서 난다고 뜹니다.
오류 : Found input variables with inconsistent numbers of samples: [1192, 298]
이렇게 뜹니다,.
뭐가 문제인지 모르겠습니다.
답변 1
0
X_tr, X_val, y_tr, y_val = train_test_split(X, y, test_size=0.2, random_state=2002) 입니다.
반환받은 변수가 잘못 작성되었어요
X, X, y, y로 외워주시고
여기에 tr, val 반복입니다.