인프런 커뮤니티 질문&답변

paul1142님의 프로필 이미지
paul1142

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

5회 기출유형 (작업형2)

기출 5회에서 보면 원핫 인코딩 get_dummies 사용시

해결된 질문

작성

·

308

0

범주형 데이터만 별도로 나누고 해주지 않고

전체 데이터로 해 주시던데 아직 초초보... 적응 단계라

get_dummies는 전체 데이터를 두고 해 줘도 되는 건가요?

 

시험이 몇 일 안 남아서 초조하고.. 과연 제가 할 수 있을까 계속 불안감이 드네요 ^^;;;;

답변 1

0

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

네 초초보면 전체 데이터에 get_dummies를 사용하면됩니다.

단 조건은 train에도 사과 배 포도가 있고

test에도 사과 배 포도가 있을 때 입니다.

 

만약 test에는 사과 포도만 있다면 결과가 달라지게 되요

이때는 레이블 인코딩 또는 합쳐서 get_dummies가 필요합니다.

paul1142님의 프로필 이미지
paul1142
질문자

다르거나 target 값 분리 해 놓고 해야 겠어요 ^^ 감사합니다.

안녕하세요 선생님
혹시 train/test에 서로 오브젝트 유니크 값이 달라서 합쳐서 one-hot 인코딩하는 예제나 수업강의가 있을까요..? 기억이 잘 안나서

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

다른 분이 작성한 코드 공유합니다.

https://www.inflearn.com/questions/1084748
참고해주세요!

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

인코딩 관련 영상을 추가했습니다.

일단 커리큘럼 제일 하단에 넣었으니 참고해주세요 🙂

paul1142님의 프로필 이미지
paul1142

작성한 질문수

질문하기