작성한 질문수
[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
해결된 질문
작성
·
136
수정됨
0
어떤 경우는 pop()을 사용하고 어떤 경우는 사용하지 않는 것 같은데, 명확히 이해가 안되서 질문 남깁니다.
pop() 으로 train셋의 target 값 보존을 위한 것인가요? 아니면
df 생성 때 pred 값이 외의 칼럼을 함꼐 출력하기 위해서인가요?
답변 1
pop()은
= 대입
drop()
두 기능을 합쳤어요
따라서
t = train.pop('target) 이라면
t변수에 대입
그리고나서 target컬럼을 삭제 합니다.타겟값을 보존하기 위함이에요
그러면
"train셋에는 존재하고 test셋에는 존재하지 않는 타겟 값 보존을 위해 사용한다"
이렇게 이해하고 사용하면 되는거겠네요
네 더불어 인코딩, 스케일링 이후의 컬럼수를 맞추기 위함이기도 합니다.
답변 감사합니다. 선생님
train, test 2셋 문제( pop 사용해 타겟 분리),
x_train.y_train,x_test 3셋 문제(타겟은 y_train에 있으니 pop 사용 불필요)
로 정리해서 진행하겠습니다
그러면
"train셋에는 존재하고 test셋에는 존재하지 않는 타겟 값 보존을 위해 사용한다"
이렇게 이해하고 사용하면 되는거겠네요