해결된 질문
작성
·
229
·
수정됨
0
라벨인코딩이랑 원핫인코딩의 경우 X_train의 데이터 타입
확인 시 object 형 컬럼이 있을때만 시행하는게 맞는걸까요?
만약 전체 컬럼이 int형 또는 float 형일때는 안해줘도 되는건가요?
만일 X_train 데이터에는 object 컬럼이 없는데 X_test 데이터에는 object 컬럼이 있어도 라벨인코딩 또는 원핫인코딩을 시행해줘야되는걸까요?
추가적으로 데이터 분리의 경우 언제 사용해주는건가요?? 작업형 2유형에서 무조건적으로 사용해줘도 문제없는건지 아니면 사용할 조건이 있는건지 궁금합니다 ㅠㅠ
답변 1
0
네!
입문자에게는 "네", / 중급자에게는 "아니요" 숫자지만 카테고리형인 경우도 있습니다.
그런 경우는 없습니다.
어떤 데이터 분리를 말하는 걸까요? 검증 데이터 분리라면 하는 방법을 추천드립니다. 하지 않으면 성능을 알지 못한채 제출하게 됩니다. 작업형2는 패턴이 있어서 작업형1, 3에 비해 처음엔 코드량이 많아 어렵더라도 몇 번 반복하다보면 쉽다고 느껴질 거에요