인프런 커뮤니티 질문&답변

joy10780님의 프로필 이미지

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

예시문제 작업형2(신 버전) 🆕 updated 2023.11

오류

해결된 질문

24.06.09 11:38 작성

·

141

·

수정됨

0

  • 학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!

  • 질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요

  • 먼저 유사한 질문이 있었는지 검색해보세요

import pandas as pd

train = pd.read_csv("data/customer_train.csv")

test = pd.read_csv("data/customer_test.csv")

pd.set_option('display.max_columns',None)

 

train['환불금액'] = train['환불금액'].fillna(0)

test['환불금액'] = test['환불금액'].fillna(0)

 

cols = train.select_dtypes(exclude='object').columns

target = train.pop('성별')

 

from sklearn.ensemble import RandomForestClassifier

rf = RandomForestClassifier()

rf.fit(train[cols], target)

pred = rf.predict_proba(test[cols])

print(pred)

 

오류

Makefile:6: recipe for target 'py3_run' failed

make: *** [py3_run] Error 1

Traceback (most recent call last):

File "/goorm/Main.out", line 29, in <module>

model.fit(train[cols], target)

File "/usr/local/lib/python3.9/dist-packages/pandas/core/frame.py", line 3511, in getitem

indexer = self.columns._get_indexer_strict(key, "columns")[1]

File "/usr/local/lib/python3.9/dist-packages/pandas/core/indexes/base.py", line 5782, in getindexer_strict

self._raise_if_missing(keyarr, indexer, axis_name)

File "/usr/local/lib/python3.9/dist-packages/pandas/core/indexes/base.py", line 5845, in raiseif_missing

raise KeyError(f"{not_found} not in index")

KeyError: "['성별'] not in index"

도와주세요 왜 select_dtypes로 쓰니까 안되나요

답변 2

0

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

2024. 06. 09. 13:01

순서 문제 맞아요

test[cols]에서 '성별' 컬럼이 없는데 cols에 사용해서 에러가 발생합니다

joy10780님의 프로필 이미지
joy10780
질문자

2024. 06. 09. 21:33

test[cols]에서 '성별' 컬럼이 없는건 이해했는데

cols에 성별을 사용했다는게 무슨 말인지 모르겠씁니다 ㅜㅜㅜ

cols= 부분이랑

pop부분

순서만 바꿔주면 되던데

왜 꼭 그래야만 하는지 이유를 모르겠어요.......

0

joy10780님의 프로필 이미지
joy10780
질문자

2024. 06. 09. 11:43

음....

cols 정의 부분하고

pop부분 순서바꾸니까 되는데

이거슨 순서가 상관없을 줄 알았는데...

명확한 이유를 모르겠씁니다.

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

2024. 06. 12. 12:54

target = train.pop('성별')은 전처리에서 가장 위에 해주세요

target이 수치형일 때 cols에 포함이 되어 버립니다. print(cols)로 정확하게 확인해 주세요~

성별은 이제 train과 test에 없는데 포함이 되니

에러가 발생합니다.

 

"기출(작업형2) 한 가지 방법으로 풀기" 영상 새로 추가한 것 봐주시겠어요?

joy10780님의 프로필 이미지

작성한 질문수

질문하기