인프런 커뮤니티 질문&답변

빅분기수강생님의 프로필 이미지

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

작업형2 피쳐엔지니어링 과정에서 pop() 을 사용하는 이유

해결된 질문

24.06.11 14:57 작성

·

112

·

수정됨

0

어떤 경우는 pop()을 사용하고 어떤 경우는 사용하지 않는 것 같은데, 명확히 이해가 안되서 질문 남깁니다.

 

pop() 으로 train셋의 target 값 보존을 위한 것인가요? 아니면

 

df 생성 때 pred 값이 외의 칼럼을 함꼐 출력하기 위해서인가요?

 

답변 1

0

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

2024. 06. 11. 20:04

pop()은

  1. = 대입

  2. drop()

두 기능을 합쳤어요

따라서

t = train.pop('target) 이라면

  1. t변수에 대입

  2. 그리고나서 target컬럼을 삭제 합니다.

    타겟값을 보존하기 위함이에요

빅분기수강생님의 프로필 이미지

2024. 06. 11. 20:14

그러면

"train셋에는 존재하고 test셋에는 존재하지 않는 타겟 값 보존을 위해 사용한다"

이렇게 이해하고 사용하면 되는거겠네요

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

2024. 06. 12. 12:46

네 더불어 인코딩, 스케일링 이후의 컬럼수를 맞추기 위함이기도 합니다.

빅분기수강생님의 프로필 이미지

2024. 06. 12. 17:05

답변 감사합니다. 선생님

train, test 2셋 문제( pop 사용해 타겟 분리),

x_train.y_train,x_test 3셋 문제(타겟은 y_train에 있으니 pop 사용 불필요)

로 정리해서 진행하겠습니다