인프런 커뮤니티 질문&답변

빅분기님의 프로필 이미지
빅분기

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

6회 기출유형 (작업형2)

6회 기출 유형(작업형2)에서 데이터 전처리 질문드립니다.

해결된 질문

작성

·

279

0

  • 학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!

  • 질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요

  • 먼저 유사한 질문이 있었는지 검색해보세요

6회 기출 유형 작업형2에서 왜 target값은 원핫인코딩을 하지 않은 것인가요?

즉,

# target컬럼 처리
target = train.pop('Heat_Load')
# 원핫 인코딩(판다스)
print(train.shape, test.shape)
train = pd.get_dummies(train)
test = pd.get_dummies(test)
print(train.shape, test.shape)

 

제 생각엔, 제출 형식이 숫자가 아니라, 'very low' 이런 형식이라서 타겟값은 데이터 전처리를 하지 않은 것인가요?

pred
Very Low
Low
High
...
Very High

답변 1

0

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

타겟의 경우 수치형으로 변경하지 않아도

랜덤포레스트와 lightgbm은 처리가 가능해 졌어요!

 

다만 xgboost는 여전히 숫자로 (0부터) 변경해야 작업 가능합니다.

빅분기님의 프로필 이미지
빅분기
질문자

정말 감사합니다 ㅠㅠ

빅분기님의 프로필 이미지
빅분기

작성한 질문수

질문하기