6회기출 작업형 2 submit 작성관련

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

6회 기출유형 (작업형2)

해결된 질문

작성

175

안녕하세요, 아래와 같이 코드 작성중

submit을 넣고 실행을 누르면 아래와 같은 typeerror가 발생하게 됩니다. 원인이 무엇인가요?

TypeError                                 Traceback (most recent call last)
<ipython-input-47-f9877fb2effc> in <cell line: 71>()
     69 
     70 pred = rf.predict(test)
---> 71 submit = pd.DataFrame({
     72     'pred' : pred
     73 })
TypeError: 'dict' object is not callable

# 머신러닝 학습 및 평가 - 랜덤포레스트
from sklearn.metrics import f1_score
from sklearn.ensemble import RandomForestClassifier
rf = RandomForestClassifier(random_state=2022)
rf.fit(X_tr, y_tr)
pred = rf.predict(X_val) # f1 score 예측 시 클래스로 나누기 확정된 값들을 원함, predict로 예측

f1_score(y_val, pred, average='macro') 
 # 실제값 y_val // 다중분류에서는 average='macro' 변수 넣어줘야함
# 0.9067668646482205

# print('===================')
# LightGBM
# import lightgbm as lgb
# lg = lgb.LGBMClassifier(random_state=0, verbose=-1)
# lg.fit(X_tr, y_tr)
# pred = lg.predict(X_val)
# f1_score(y_val, pred, average='macro') 

#   # 0.9319703995747777

# # 예측, 결과파일 생성
# # test 예측 - pred에서

pred = rf.predict(test) 
submit = pd.DataFrame({
    'pred' : pred
})

python 머신러닝 빅데이터 pandas 빅데이터분석기사

답변 1

퇴근후딴짓

지식공유자

import pandas as pd
코드가 어디에 있을까요? 다시 풀러와서 재실행 해보시죠!

최지훈

질문자

# 예측할 값(y): Heat_Load (Very Low, Low, Medium, High, Very High)
# 다중분류
# 평가: f1-macro
# 타겟: 문자(5가지)
import pandas as pd
train = pd.read_csv('energy_train.csv')
test = pd.read_csv('energy_test.csv')
train.shape, test.shape
# print(train.head(2))
# print(test.head(1))
# Target : Heat_Load  
# print(train.info()) # 수치형 6, object 4
# print(train['Roof'].value_counts())
# print(train.describe(include='object')) # unique 4, 2, 4 / Heat_Load는 뺄거임
# print(test.describe(include='object')) # unique 4, 2, 4 확인

# 결측치 확인 ... train, test 모두 결측치 없음
# print(train.isnull().sum())
# print(test.isnull().sum())
# target 확인
train['Heat_Load'].value_counts()

## 전처리
# target 컬럼 처리
target = train.pop('Heat_Load')
# 원-핫 인코딩
# print(train.shape, test.shape)
train = pd.get_dummies(train)
test = pd.get_dummies(test)
# print(train.shape, test.shape)

# 검증 데이터 분할 *
from sklearn.model_selection import train_test_split
X_tr, X_val, y_tr, y_val = train_test_split(train, target, test_size=0.2, random_state=0)# train, test가 아니라 / train, target임
# print(X_tr.shape, X_val.shape, y_tr.shape, y_val.shape)

# 머신러닝 학습 및 평가 - 랜덤포레스트
from sklearn.metrics import f1_score
from sklearn.ensemble import RandomForestClassifier
rf = RandomForestClassifier(random_state=2022)
rf.fit(X_tr, y_tr)
pred = rf.predict(X_val) # f1 score 예측 시 클래스로 나누기 확정된 값들을 원함, predict로 예측
f1_score(y_val, pred, average='macro')  # 실제값 y_val // 다중분류에서는 average='macro' 변수 넣어줘야함
# 0.9067668646482205
# LightGBM
# import lightgbm as lgb
# lg = lgb.LGBMClassifier(random_state=0, verbose=-1)
# lg.fit(X_tr, y_tr)
# pred = lg.predict(X_val)
# f1_score(y_val, pred, average='macro') 
   # 0.9319703995747777

# # 예측, 결과파일 생성
# # test 예측 - pred에서
pred = rf.predict(test) 
submit = pd.DataFrame({
    'pred' : pred   # ★ 에러지점
})
# submit.to_csv('0000.csv', index=False)

최지훈

질문자

위와 같이 첨부드립니다!

코드 실행 시 아래 에러가 발생합니다.

---------------------------------------------------------------------------
TypeError                                 Traceback (most recent call last)
<ipython-input-47-f9877fb2effc> in <cell line: 71>()
     69 
     70 pred = rf.predict(test)
---> 71 submit = pd.DataFrame({
     72     'pred' : pred
     73 })
TypeError: 'dict' object is not callable

6/20 08:08 현재 - 다시 코드 넣어보니, 제대로 csv파일이 나오네요... 저 dict 에러는 왜 나오는걸까요..

퇴근후딴짓

지식공유자

저도 잘은 모르겠지만

코드상 문제가 없는 것으로 봐서는

주피터 노트북은 다른 셀의 영향이 있을 수 있어요~!!

2일 남았네요~~ 화이팅입니다!

인프런 커뮤니티 질문&답변

6회기출 작업형 2 submit 작성관련