model.fit에러

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

해결된 질문

작성

543

작업형2 기출2회 풀다가 에러가 생겨서 문의드립니다.
원인이 뭘까요...ㅠ

from sklearn.ensemble import RandomForestClassifier
model= RandomForestClassifier(random_state=200)
model.fit(X_tr,y_tr)
pred=model.predict_proba(x_val)

[전체코드]

import pandas as pd

X_train=pd.read_csv('X_train.csv')

y_train=pd.read_csv('y_train.csv')

X_test=pd.read_csv('X_test.csv')

X_train=X_train.drop(['ID'], axis=1)

IDX=X_test.pop('ID')

from sklearn.preprocessing import LabelEncoder

la=LabelEncoder()

cols=['Mode_of_Shipment','Product_importance','Gender']

for col in cols:

X_train[col]=la.fit_transform(X_train[col])

X_test[col]=la.transform(X_test[col])

from sklearn.model_selection import train_test_split

X_tr, X_val, y_tr, y_val=train_test_split(X_train,

y_train['Reached.on.Time_Y.N'],

test_size=0.2,

random_state=200)

# 모델링

from sklearn.ensemble import RandomForestClassifier

model= RandomForestClassifier(random_state=200)

model.fit(X_tr,y_tr)

pred=model.predict_proba(x_val)

python 머신러닝 빅데이터 pandas 빅데이터분석기사

답변 2

퇴근후딴짓

지식공유자

하하 스스로 해답을 찾았네요!!

멋집니다!! 👍

arinmedical27

질문자

다시확인해보니 라벨인코딩할때, Warehouse_block 컬럼을 빠뜨려서 다시추가해주고 돌렸습니다.
그런데, 그래도 다음과 같은 에러가 뜹니다...

ValueError: could not convert string to float: 'D'

arinmedical27

질문자

오 해결했습니다.

pred=model.predict_proba(x_val)에서 X_val으로 써야하는데 잘못썻네요...

시험장에서 model.fit 에러시에 기존 라벨인코딩에서 object 누락된것이 있는지 확인해 보겠습니다~

인프런 커뮤니티 질문&답변

model.fit에러