인프런 커뮤니티 질문&답변

한정수님의 프로필 이미지

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

인코딩 할 때 에러가 난다면? 🆕 updated 2023.11

타겟 질문

해결된 질문

24.06.19 21:19 작성

·

97

0

pop함수 사용해서 타겟 뽑아내는거는 웬만하면 인코딩/ 스케일링 하기 전에 하는게 좋을까요???범주형 타겟이라고 해서 학습안하고 그러지는 않겠죠?ㅜㅜ오늘 xgboost했는데 fit될때 타겟 데이터 타입이 문제다 이런 오류가 떠서 헷갈려요ㅠ

답변 2

0

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

2024. 06. 20. 03:14

  1. 타겟 뽑아내는 것은 전처리중 가장 먼저해주세요

  2. 범주형(문자) 타겟일 경우 학습/예측은 가능하지만 평가 지표에 따라 별도 설정(양성)이 필요할 수 있어요

  3. xgboost는 타겟이 문자이거나 숫자여도 0부터 시작하지 않으면 에러가 발생합니다. 비슷한 부스팅계열인 lightgbm추천합니다.

0

인프런 AI 인턴님의 프로필 이미지

2024. 06. 19. 21:21

안녕하세요, 인프런 AI 인턴입니다.

한정수 님의 질문에 대해 답변드립니다. 타겟 변수를 다루는 과정에서 pop 함수를 사용하여 타겟 변수를 데이터 세트에서 분리하는 것은 일반적으로 데이터 전처리 단계에서 추천되는 방법입니다. 이렇게 하는 이유는 데이터 전처리 과정에서 타겟 변수가 전처리되지 않도록 보호하기 위해서입니다. 타겟 변수가 범주형일 경우, 학습 과정에서 문제가 되지 않도록 적절한 타입 변환이 필요할 수 있습니다. XGBoost와 같은 일부 모델은 특히 타겟 데이터의 타입에 민감할 수 있으니, 타입이 올바르게 설정되었는지 확인하는 것이 중요합니다.

질문에 대한 구체적인 조언을 포함한 기존 답변을 참고하면 도움이 될 것 같습니다. 전처리 과정에서 최적의 순서를 따르고 문제 해결하는 방법에 대해 설명한 답변이 있습니다:

  • 작업형 2 고민끝에 정리하여 질문드립니다.에서, 타겟 변수 처리 위치에 대한 조언과 범주형 데이터 인코딩 방식, 그리고 데이터 전처리 과정의 중요성에 대해 설명합니다. 특히 작업형 문제에서 타겟 변수를 어떻게 다루어야 할지 구체적인 사례를 통해 설명하고 있습니다.

이 답변은 데이터 전처리 과정에서 타겟 변수를 어떻게 다루어야 하는지, 그리고 XGBoost 사용시 필요한 데이터 타입 관련 문제 해결에 대한 유용한 정보를 제공합니다. 타겟 변수를 pop 함수로 분리하는 것은 데이터 전처리 시작 전에 하는 것이 좋으며, 학습 과정에서 타입 문제가 발생하지 않도록 적절한 데이터 타입 설정이 중요함을 다시 한번 강조합니다.

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.