작성한 질문수
[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
피처 엔지니어링
해결된 질문
작성
·
105
0
수치형 민맥스 스케일링 할때는 반복문을 사용하지 않고 한번에 함수에 넣고 fit_transform하였는데 왜 라벨 인코딩 (문자열)은 한번에 처리 안되고 반복문을 통해서 하나씩 함수에 넣어야 하나요?
답변 1
네, 맞습니다. 그렇게 처리해야 합니다 😃왜 한 번에 안될까 싶으시죠?
1. 숫자는 한번에 처리가 가능합니다. 스케일링 함수도 그렇게 만들어졌고요~2. 문자는 각 컬럼별로 사전을 먼저 만들고 맵핑해야 하는 작업들이 함수내에서 처리 되므로 라벨 인코더는 각 컬럼별 처리가 필요해요 (예를 들어, "red", "green", "blue"와 같은 문자열 값들을 0, 1, 2와 같은 정수로 변환)