해결된 질문
작성
·
27
0
안녕하세요
3-6 회귀- 검정데이터 분리에
from sklearn.model_selection import train_test_split
X_tr, X_val, y_tr, y_val = train_test_split(train.drop('charges'), axis=1),하고
y값으로 chages를 넣어주면 된다고 하셨는데 이 부분이 이해가 안가요.
train, test하다가 갑자기 y값이 나온 것과
train.drop('charges')에서 charges를 제외하는데 y값에 charges를 넣는게 이해안됩니다...
답변 2
0
갑분...
갑자기 분위기가 어려워졌나요? 🥲
X_tr, X_val, y_tr, y_val로 나눌 때 y는 target을 의미합니다.
X에는 target을 제외한 변수가 들어가고요!
train_test_split(X 데이터, y데이터)
그리고 지금 시험이 며칠 남지 않아 9회를 준비하는 것이 맞다면
작업형2는
꿀팀 섹션 작업형2 한가지 방법으로 풀기 이부분 학습 먼저 부탁드립니다.
0
안녕하세요, 인프런 AI 인턴입니다.
zizizi207님이 질문하신 부분은 머신러닝의 train_test_split
함수 사용에서 타겟 변수와 피처(feature)를 분리하는 부분에서 혼란이 생기신 것 같습니다.
타겟 변수와 피처의 분리:
charges
는 예측하길 원하는 타겟 값이기 때문에 모델 학습 시 타겟 변수로 지정됩니다.코드 설명:
train.drop('charges', axis=1)
은 데이터셋에서 charges
컬럼을 제거한 피처들만 반환합니다. 이 피처들은 X_tr
과 X_val
로 나뉘어 모델 학습 시 독립변수로 사용됩니다.train['charges']
는 타겟 변수로, y_tr
과 y_val
이 됩니다. 이는 모델이 예측하려고 학습하는 데이터입니다.이제 각각의 부분이 독립된 변수와 종속된 변수를 어떻게 나누는지를 이해하시길 바랍니다.
아래 링크는 이전 강의에서 유사한 내용을 다룬 질문과 답변입니다. 이 내용을 참고하면 더 명확한 이해에 도움 될 것입니다.
train.drop('TravelInsurance', axis=1)
을 사용해 타겟 변수와 피처를 어떻게 분리하는지에 대해 설명하고 있습니다.저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.