작성한 질문수
[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
인코딩 할 때 에러가 난다면?
해결된 질문
작성
·
116
0
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!
질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요
먼저 유사한 질문이 있었는지 검색해보세요
저는 레이블인코딩으로 밀고나갈건데요!
train의 범주형 컬럼의 카테고리 ⊂ test의 범주형 칼럼의 카테고리 이거나 아예 두개가 다를 경우만
train, test 합친 후에 레이블 하고
나머지의 경우는 그냥 레이블인코딩 하는걸로 암기하면되나요?
답변 1
레이블 인코딩시
train에는 있는데 test에는 없다면 그대로 진행
test에는 있는데 train에는 없는 카테고리가 있다면 합쳐서 인코딩이 필요합니다.
그렇다면 예를들어
train = 국어 수학 영어
test = 과학 수학 영어
이렇게 있으면
train에 국어가 있는데 test에 국어가 없으니 그대로 진행하려다가
test에 과학이 있는데 train에 없으니까 합쳐서 인코딩해야되는 상황인데 맞나요?
그러면 결국 test를 먼저 보고 그게 train에 있는지 없는지만 확인해주면 되는거 맞나요?
test 보고 train에 없으면? -> 합쳐서 진행
그게 아닌 다른 어떤 경우라도 -> 그냥 그대로 진행
네 맞습니다.
그렇다면 예를들어
train = 국어 수학 영어
test = 과학 수학 영어
이렇게 있으면
train에 국어가 있는데 test에 국어가 없으니 그대로 진행하려다가
test에 과학이 있는데 train에 없으니까 합쳐서 인코딩해야되는 상황인데 맞나요?
그러면 결국 test를 먼저 보고 그게 train에 있는지 없는지만 확인해주면 되는거 맞나요?
test 보고 train에 없으면? -> 합쳐서 진행
그게 아닌 다른 어떤 경우라도 -> 그냥 그대로 진행