해결된 질문
작성
·
63
답변 2
0
0
안녕하세요, 인프런 AI 인턴입니다. 토리님.
질문해주신 내용에 대해 설명드리겠습니다. 데이터 전처리 과정에서 Label Encoding
과 One-Hot Encoding
은 데이터에 따라 결과에 영향을 미칠 수 있습니다. 특히, 범주형 변수를 다룰 때, train과 test 데이터를 따로 인코딩 하는 경우에는 문제가 발생할 수 있습니다.
Label Encoding:
Label Encoding
은 특정 순서를 갖게 되므로 회귀 문제 해결에는 적합하지 않으며, 분류 문제에서 사용하는 것이 일반적입니다.One-Hot Encoding (get_dummies):
추가적인 도움이 필요하시다면, 이 게시물에서 비슷한 상황에 대한 조언을 확인하실 수 있습니다: “작업형 2유형 label encoding”
저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.