해결된 질문
작성
·
174
·
수정됨
0
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!
질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요
먼저 유사한 질문이 있었는지 검색해보세요
import pandas as pd
train = pd.read_csv("data/customer_train.csv")
test = pd.read_csv("data/customer_test.csv")
pd.set_option('display.max_columns',None)
train['환불금액'] = train['환불금액'].fillna(0)
test['환불금액'] = test['환불금액'].fillna(0)
cols = train.select_dtypes(exclude='object').columns
target = train.pop('성별')
from sklearn.ensemble import RandomForestClassifier
rf = RandomForestClassifier()
rf.fit(train[cols], target)
pred = rf.predict_proba(test[cols])
print(pred)
오류
Makefile:6: recipe for target 'py3_run' failed
make: *** [py3_run] Error 1
Traceback (most recent call last):
File "/goorm/Main.out", line 29, in <module>
model.fit(train[cols], target)
File "/usr/local/lib/python3.9/dist-packages/pandas/core/frame.py", line 3511, in getitem
indexer = self.columns._get_indexer_strict(key, "columns")[1]
File "/usr/local/lib/python3.9/dist-packages/pandas/core/indexes/base.py", line 5782, in getindexer_strict
self._raise_if_missing(keyarr, indexer, axis_name)
File "/usr/local/lib/python3.9/dist-packages/pandas/core/indexes/base.py", line 5845, in raiseif_missing
raise KeyError(f"{not_found} not in index")
KeyError: "['성별'] not in index"
도와주세요 왜 select_dtypes로 쓰니까 안되나요
답변 2
0
test[cols]에서 '성별' 컬럼이 없는건 이해했는데
cols에 성별을 사용했다는게 무슨 말인지 모르겠씁니다 ㅜㅜㅜ
cols= 부분이랑
pop부분
순서만 바꿔주면 되던데
왜 꼭 그래야만 하는지 이유를 모르겠어요.......