인프런 커뮤니티 질문&답변

석구님의 프로필 이미지
석구

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

예시문제 작업형2(신 버전) 🆕 updated 2023.11

예시문제 작업형2(신버전) 레이블인코딩 관련 질문입니다.

해결된 질문

작성

·

185

0

레이블 인코딩 시, train은 fit_transform 하고 test는 fit작업만 하는데 혹시 포문을 이용하지 않고

train['주구매상품'] = le.fit_transform(train['주구매상품'])

train['주구매지점'] = le.fit_transform(train['주구매지점'])

test['주구매상품'] = le.fit(test['주구매상품'])

test['주구매지점'] = le.fit(test['주구매지점'])

이런식으로 하드코딩 해줄때도 동일하게 test는 fit처리만 하면 되나요?

 

답변 2

1

석구님의 프로필 이미지
석구
질문자

train['주구매상품'] = le.fit_transform(train['주구매상품'])
test['주구매상품'] = le.transform(test['주구매상품'])
train['주구매지점'] = le.fit_transform(train['주구매지점'])
test['주구매지점'] = le.transform(test['주구매지점'])

이런식으로 순서를 변경하면 오류가 발생하지 않는데.. 순서가 관계가 있나요.
퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

네 지금 le를 덮어쓰고 있어서 순서가 상관있습니다 🙂

반복문을 사용하지 않는다면 말씀하신 방식을 사용해주세요

1

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

네 반복문을 사용하지 않는 방식은 맞습니다 다만

test는 transform 만하는 것입니다.

fit은 잘못된 방식이에요!

석구님의 프로필 이미지
석구

작성한 질문수

질문하기