작성한 질문수
[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
해결된 질문
작성
·
94
0
타겟값이 범주형일 때, 라벨인코딩 하기 전에 target=train.pop()을 통해서 타겟컬럼만 따로 빼주셨는데
train.drop('Heat_Load',axis=1).select_dtypes(include='O').columns
을 이용하여 컬럼값을 변수에 저장해놓고 라벨인코딩을 하는 것도 상관없는지 궁금하여 여쭈어봅니다 !!
답변 1
네 전처리 시작할 때 문자던 숫자던
target = train.pop('Heat_Load') 으로 따로 빼주세요
그래야 인코딩, 스케일링에 영향을 받지 않아요!!:)
질문주신 위 방법도 괜찮습니다.
만약 판다스 인코딩으로
train = pd.get_dummies(train)을 사용하면 자동으로 object만 선택해 인코딩 합니다.
이방법을 사용한다면 미리 제외하는 것이 좋습니다.