인프런 커뮤니티 질문&답변

munjihey1127님의 프로필 이미지
munjihey1127

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

5회 기출유형 (작업형2)

5회 기출유형 작업2

해결된 질문

작성

·

145

0

4회 기출유형 작업형 2에서는 train_test_split을 사용안했는데여기서는 왜 사용하는 걸까요?

 

train_test_split을 사용할때와 안할때가 궁금합니다

  • 원핫인코딩과 라벨인코딩 두개를 =어떨때 써야하는지도 궁금합니다

그리고 Y_tr 에 price를 넣으신 이유가 있으실까요

 

ps. 매번 친절하게 답변해주셔서 감사합니다

답변 1

0

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

train_test_split 사용 여부

필수가 아니에요~!! 모델을 평가해보고 싶다면 사용할 수 있습니다.

만약 레이블 인코딩이나 원핫인코딩을 비교하고 싶다면 사용이 필요합니다.

정말 긴급히 준비하는 사람에게는 없이 제출하라고 알려드리기도 했어요!

 

원-핫 인코딩 또는 라벨 인코딩

은 범주형 object 자료형이 있다면 반드시 사용해야 합니다.

편한 방법을 사용해주세요! 둘 다 성능을 비교해봐도 좋아요.

 

y_tr에 price가 있는 것은

train_test_split 를 사용하면서 검증데이터와 분할했을 때 들어갔어요

학습 데이터가 80%, 검정데이터가 20%으로 분리 했다면

y_tr에는 80%의 price값이 들어있습니다.

munjihey1127님의 프로필 이미지
munjihey1127
질문자

감사합니다 :)

munjihey1127님의 프로필 이미지
munjihey1127

작성한 질문수

질문하기