인프런 커뮤니티 질문&답변

tmdwjsofficial님의 프로필 이미지
tmdwjsofficial

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

2회 기출유형(작업형2)

x_train, y_train 분리 시

해결된 질문

작성

·

29

0

현재는 train.csv로 출제되기에,

인코딩 전 타겟데이터를 분리해서

target = train.pop('col') 하잖아요?

 

만약 x_train, y_train 분리 시, 인코딩 전에

(혹은 아무 과정에서나)

target = y_train.pop('col') 처럼 분리해도 되죠?

이 과정이 모델링 시,

model.fit(x_train, y_train['col'])과 마찬가지인 것이죠??

 

답변 2

0

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

네 정확합니다.

그런데 앞에서 분리를 했다면 더이상 y_train 에는 타겟이 없어요

model.fit(x_train, target) 이 되겠네요

0

안녕하세요, 인프런 AI 인턴입니다. tmdwjsofficial님.

질문 주신 내용은 데이터 전처리 과정에서 타겟 변수를 분리하는 시점과 방법에 관한 것으로 보입니다. 주어진 상황에서 x_trainy_train 데이터프레임이 분리되어 있는 경우에도, 특정 컬럼을 타겟으로 설정하여 분리하는 방법에 대해 궁금해하시는 것 같습니다.

  1. 타겟 변수 분리 시점: target = train.pop('col') 방식을 사용하는 것은 주로 데이터프레임에서 타겟 컬럼을 별도로 관리하기 위해 초기 전처리 과정에서 사용하는 방법입니다. x_trainy_train이 이미 분리되어 있다면, y_train에서 타겟 컬럼을 분리하는 것도 가능합니다. 이는 데이터가 어떻게 준비되어 있는가에 따라 다를 수 있습니다.

  2. 사용법의 차이: model.fit(x_train, y_train['col']) 방식은 보통 y_train이 데이터프레임 형태라면 특정 컬럼을 타겟 값으로 지정하여 모델을 학습시키는 경우입니다. y_train.pop('col')로 타겟을 분리해놓을 경우에는 이후 model.fit(x_train, target)와 같이 사용하시면 됩니다. 결국 모델링에 있어서는 타겟이 명확하게 분리되어 있는지가 중요합니다.

관련하여 더 나은 이해를 위해 유사한 질문에 대한 다음 링크를 추천드립니다: y_tr과 y_train 의 차이점. 이 질문에서는 y_train에서 특정 컬럼을 추출하여 타겟 변수로 사용했을 때의 예시와 차이점에 대해 설명하고 있습니다.

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

tmdwjsofficial님의 프로필 이미지
tmdwjsofficial

작성한 질문수

질문하기