인프런 커뮤니티 질문&답변

daeho4.kim님의 프로필 이미지
daeho4.kim

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

예시문제 작업형2(구 버전): 학습시간 최소화를 위해 구 버전은 삭제하고 있어요!

질문있습니다.

해결된 질문

작성

·

233

0

라벨 인코더 실행할 때나, 스케일러 실행할 때,

X_train 에서는 fit_transform 함수를 사용하고

X_test 에서는 transform 함수를 사용하는데,

무슨 차이가 있는지 궁금합니다.

답변 2

1

daeho4.kim님의 프로필 이미지
daeho4.kim
질문자

이해하기 쉽게 설명해주셔서 감사드립니다! :)

1

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

X_train 에서 fit_transform 함수는

fit 과 transform 2개를 합쳐놓았어요

예를들어

fit은 train에 사과와 배 2개가 있는 것을 학습하고 사과는 0, 배는 1로 사전을 만들고

transform에서 문자를 숫자로 적용합니다(라벨인코딩)

train과 동일하게 test도 적용하기 위해 test는 transform만 적용해요 😆

스케일링/인코딩 과정에서 데이터를 학습시킨다는 게 어떤 의미가 있을까요?

모델을 만들어 학습시키는 것과는 다른 개념인가요?

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

민영님,
1. 네 다른 개념입니다. 모델학습은 별개입니다.
2. 스케일링/인코딩 중 인코딩을 예를들어 설명하면
train을 fit할 때 사전을 만들어요. 딸기->1, 사과->2, 배->3
그리고 transform으로 train데이터에 배, 배, 사과, 딸기가 있다면 3,3,2,1로 변경하는거죠
그걸 fit_transform으로 한번에 수행한답니다.

test는 새롭게 fit하는 것이 아니라 train에서 만든 사전을 활용해 transform만 적용하는거죠!

상세하고 빠른 답변 감사드립니다!! 학습에 많은 도움이 됩니다. 12월 시험 꼭 합격하겠습니다.

daeho4.kim님의 프로필 이미지
daeho4.kim

작성한 질문수

질문하기