인프런 커뮤니티 질문&답변

moonwrd님의 프로필 이미지
moonwrd

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

8회 기출유형(작업형2) 🆕 updated 2024.9

인코딩문의

작성

·

37

0

ㅅ선생님 이전 8회 실기준비할 때 보면

대부분 원-핫 인코딩으로 하는 분위기였는데

이번에도 그렇게 준비해도 충분 하겠죠?

뭐랄까 Label Encoder는 실전에서 코드가 생각 잘 안나기도 하고 그래서요 ㅠㅠ

 

타겟값 옮겨겨놓기

target = train.pop('total')

# 원핫 인코딩

train = pd.get_dummies(train)

test = pd.get_dummies(test)

# 데이터 분할을 해보자

from sklearn.model_selection import train_test_split

X_tr, X_val, y_tr, y_val = train_test_split(train, target, test_size=0.2, random_state=0)

# 랜포에 넣어보자

from sklearn.ensemble import RandomForestRegressor

rf = RandomForestRegresosr(random_state=0)

rf.fit(X_tr, y_tr)

pred = rf.predict(X_val)

# 제출 해보자

pred = rf.predict(test)

submit = pd.DataFrame({'pred': pred})

 

 

이렇게만 해서 40점은 받긴 했는데... (저번에 1유형 0점맞아서 재수 중..ㅠㅠ)

 

submit.to_csv("result.csv", Index=False)

 

답변 1

0

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

2~8회 기준으로 이 코드로만 40점 충분했어요!

만약 분류면 분류모델을 사용하는 것이 있을 수 있고요!! (확률값 사용 등)

moonwrd님의 프로필 이미지
moonwrd
질문자

넵 인코딩은 크게 문제 없는거 같고

루틴대로 잘 해야겠어요 ㅠㅠ

 

선생님 그나저나 해설강의중에 1-3 오즈비 구하는 강의는 생략된걸가요?

moonwrd님의 프로필 이미지
moonwrd

작성한 질문수

질문하기