인프런 커뮤니티 질문&답변

윰님의 프로필 이미지

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

타겟 데이터 분리

해결된 질문

작성

·

89

0

안녕하세요.

데이터 전처리 단계에서 target = train.pop('target') 타겟 처리하는 방법과

검증 데이터 분리 단계에서

이렇게 하는 방법 중에 어떤방법을 선택하던 결과에 영향이 없나요?

그리고 데이터 전처리 시에 target분리할 경우에 target 데이터가 수치형이나 범주형 상관 없이 데이터 전처리 전에 분리하면 되는건지요?

답변 2

0

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

네! 상관없습니다.

동일한 코드를 원한다면 전처리 시작과 동시에

target = train.pop('target') 처리하고 시작하시죠!!
꿀팁에 있는 아래 영상에서는 한가지 방법으로만 풀이 했어요!

기출(작업형2) 한 가지 방법으로 풀기 🆕 updated 2024.6

0

안녕하세요, 인프런 AI 인턴입니다. 윰님께서 데이터 전처리와 타겟 처리에 대해 궁금하신 점을 남겨주셨군요. 관련된 몇 가지 기존의 유사한 질문답변과 함께 설명드립니다.

  1. 타겟 데이터 분리에 대한 주요 개념: 타겟 데이터를 전처리의 초기 단계에서 분리하는 것은 일반적입니다. 이는 데이터 변환이나 인코딩 과정에서 타겟 데이터가 변경되지 않도록 하기 위함입니다. 타겟 변수가 수치형이든 범주형이든, 일반적으로 전처리 전에 분리하는 것이 좋습니다.

  2. 타겟 인코딩 문제: 만약 타겟이 범주형 데이터라면, 일부 알고리즘들(예: XGBoost)에서는 타겟을 ‘라벨 인코딩’ 해야 할 수도 있습니다. 하지만 일반적으로는 타겟을 원본 그대로 유지한 후, 기계 학습 모델에서 처리되기를 선호합니다. 관련된 질문과 답변에서 “target, 즉 우리가 예측하려는 값이 범주형인 경우”라는 문제를 다루고 있습니다.

  3. 측정 및 평가 지표: 타겟의 특성에 따라 모델 평가 지표를 결정할 때 양성 값 등으로 지정하는 방법도 중요합니다. 이 점은 위의 링크된 답변에서 자세히 설명하고 있습니다.

  4. 데이터 전처리 및 팝 방법: 데이터 프레임에서 타겟을 분리할 때 ‘pop’ 함수를 사용하면, 기존 데이터 프레임에서 타겟 열이 사라지면서 따로 반환됩니다. 이 방식은 명확한 전처리 흐름을 유지할 수 있게 도와줍니다.

더 많은 정보는 관련 데이터 전처리시 궁금점! 포스팅에서 확인할 수 있습니다.

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다. 현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏 추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

윰님의 프로필 이미지

작성한 질문수

질문하기