인프런 커뮤니티 질문&답변

zizizi207님의 프로필 이미지
zizizi207

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

모델링 및 평가(회귀)

3-6 검증데이터 분리에서 갑분y.. 뭘까요?

해결된 질문

작성

·

27

0

안녕하세요

3-6 회귀- 검정데이터 분리에

from sklearn.model_selection import train_test_split

X_tr, X_val, y_tr, y_val = train_test_split(train.drop('charges'), axis=1),하고

y값으로 chages를 넣어주면 된다고 하셨는데 이 부분이 이해가 안가요.

train, test하다가 갑자기 y값이 나온 것과

train.drop('charges')에서 charges를 제외하는데 y값에 charges를 넣는게 이해안됩니다...

 

답변 2

0

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

갑분...

갑자기 분위기가 어려워졌나요? 🥲

X_tr, X_val, y_tr, y_val로 나눌 때 y는 target을 의미합니다.

X에는 target을 제외한 변수가 들어가고요!

train_test_split(X 데이터, y데이터)

 

그리고 지금 시험이 며칠 남지 않아 9회를 준비하는 것이 맞다면

작업형2는

꿀팀 섹션 작업형2 한가지 방법으로 풀기 이부분 학습 먼저 부탁드립니다.

 

 

 

0

안녕하세요, 인프런 AI 인턴입니다.

zizizi207님이 질문하신 부분은 머신러닝의 train_test_split 함수 사용에서 타겟 변수와 피처(feature)를 분리하는 부분에서 혼란이 생기신 것 같습니다.

핵심 개념 설명:

  1. 타겟 변수와 피처의 분리:

    • 머신러닝 모델을 학습하려면 데이터를 타겟 변수(예측할 값)와 피처(설명변수)로 나누어야 합니다. 여기서 charges는 예측하길 원하는 타겟 값이기 때문에 모델 학습 시 타겟 변수로 지정됩니다.
  2. 코드 설명:

    • train.drop('charges', axis=1)은 데이터셋에서 charges 컬럼을 제거한 피처들만 반환합니다. 이 피처들은 X_trX_val로 나뉘어 모델 학습 시 독립변수로 사용됩니다.
    • train['charges']는 타겟 변수로, y_try_val이 됩니다. 이는 모델이 예측하려고 학습하는 데이터입니다.

이제 각각의 부분이 독립된 변수와 종속된 변수를 어떻게 나누는지를 이해하시길 바랍니다.

아래 링크는 이전 강의에서 유사한 내용을 다룬 질문과 답변입니다. 이 내용을 참고하면 더 명확한 이해에 도움 될 것입니다.

  • 데이터 분리할때에서 비슷한 질문이 있었으며, train.drop('TravelInsurance', axis=1)을 사용해 타겟 변수와 피처를 어떻게 분리하는지에 대해 설명하고 있습니다.

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.

현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏

추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

zizizi207님의 프로필 이미지
zizizi207

작성한 질문수

질문하기