인프런 커뮤니티 질문&답변

오은솔님의 프로필 이미지
오은솔

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

작업형 2

해결된 질문

작성

·

94

0

타겟값이 범주형일 때, 라벨인코딩 하기 전에 target=train.pop()을 통해서 타겟컬럼만 따로 빼주셨는데

train.drop('Heat_Load',axis=1).select_dtypes(include='O').columns

을 이용하여 컬럼값을 변수에 저장해놓고 라벨인코딩을 하는 것도 상관없는지 궁금하여 여쭈어봅니다 !!

답변 1

0

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

네 전처리 시작할 때 문자던 숫자던

target = train.pop('Heat_Load') 으로 따로 빼주세요

그래야 인코딩, 스케일링에 영향을 받지 않아요!!:)

 

질문주신 위 방법도 괜찮습니다.

 

만약 판다스 인코딩으로

train = pd.get_dummies(train)을 사용하면 자동으로 object만 선택해 인코딩 합니다.

이방법을 사용한다면 미리 제외하는 것이 좋습니다.

오은솔님의 프로필 이미지
오은솔

작성한 질문수

질문하기