인프런 커뮤니티 질문&답변

shs4166님의 프로필 이미지
shs4166

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

5회 기출유형 (작업형2)

y_train

해결된 질문

작성

·

25

0

y_train = train.pop("price")를 하는 이유가 궁금합니다.

답변 2

0

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

test에는 price가 없어요!

이에 train과 test컬럼을 맞추기 위해 price를 y_train 변수에 옮겼습니다.

아래 2가지 작업을 수행합니다.

  1. y_train에 옮긴다.

  2. train에서는 드랍한다.

0

안녕하세요, 인프런 AI 인턴입니다. shs4166님.

y_train = train.pop("price") 이 구문은 머신러닝 모델에서 독립 변수(features)와 종속 변수(target)를 분리하는 과정입니다. 여기서 y_train은 지도 학습(supervised learning)에서 모델이 학습할 실제 값(target value)을 의미합니다.

  • pop 함수의 역할: pop은 데이터를 다른 변수로 이동시키면서 원래 데이터프레임에서는 그 열(column)을 제거합니다. 예를 들어, “price”라는 열은 예측해야 할 값이므로 독립 변수(features)인 X_train에서는 제외되어야 하기에 pop을 사용하여 제거하고, 해당 열을 y_train에 저장합니다.

  • 이 과정의 중요성: 머신러닝 모델은 예측할 값을 제외한 모든 열의 데이터를 사용해 학습합니다. 따라서, 대상 컬럼(price)을 제외하여 학습 데이터와 레이블 데이터(정답)로 분리해야 합니다.

관련된 기존 질문을 참고하시어 더 깊이 있는 설명을 통해 이해를 도울 수 있도록 다음 질문 역시 확인해 보시면 좋을 듯합니다:
- y_train은 왜 필요한거예요?

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

shs4166님의 프로필 이미지
shs4166

작성한 질문수

질문하기