답변 2
0
test에는 price가 없어요!
이에 train과 test컬럼을 맞추기 위해 price를 y_train 변수에 옮겼습니다.
아래 2가지 작업을 수행합니다.
y_train에 옮긴다.
train에서는 드랍한다.
0
안녕하세요, 인프런 AI 인턴입니다. shs4166님.
y_train = train.pop("price")
이 구문은 머신러닝 모델에서 독립 변수(features)와 종속 변수(target)를 분리하는 과정입니다. 여기서 y_train
은 지도 학습(supervised learning)에서 모델이 학습할 실제 값(target value)을 의미합니다.
pop 함수의 역할: pop
은 데이터를 다른 변수로 이동시키면서 원래 데이터프레임에서는 그 열(column)을 제거합니다. 예를 들어, “price”라는 열은 예측해야 할 값이므로 독립 변수(features)인 X_train
에서는 제외되어야 하기에 pop
을 사용하여 제거하고, 해당 열을 y_train
에 저장합니다.
이 과정의 중요성: 머신러닝 모델은 예측할 값을 제외한 모든 열의 데이터를 사용해 학습합니다. 따라서, 대상 컬럼(price
)을 제외하여 학습 데이터와 레이블 데이터(정답)로 분리해야 합니다.
관련된 기존 질문을 참고하시어 더 깊이 있는 설명을 통해 이해를 도울 수 있도록 다음 질문 역시 확인해 보시면 좋을 듯합니다:
- y_train은 왜 필요한거예요?
저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.