해결된 질문
작성
·
175
·
수정됨
0
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!
질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요
먼저 유사한 질문이 있었는지 검색해보세요
1) 작업형2 모의문제1에서 'CLIENTNUM' 컬럼은 왜 삭제되어야 하는건지 이해가 안돼서 질문 드립니다 ! ㅠㅠ
2) 데이터 전처리&피처 엔지니어링 과정에서 아래와 같이 문제에서 주어진 값에 대해 train 데이터에서는 id를 삭제하고, test 데이터에서는 복사하는데요 이러한 과정은 왜 train에서는 삭제를 하고 test 데이터는 복사하는건지 잘 이해가 안되네요ㅠㅠ
train = train.drop('id', axis=1)
test_id = test.pop('id')
test.head()
3) X_tr, X_val, y_tr, y_val 데이터가 각각 무엇을 의미하는지 헷갈립니다ㅠㅠ 쉬운 설명 부탁드려요ㅠㅠ
답변 1
0
문제에서 제출 파일에 test_id를 포함해서 csv를 만들어라고 되어 있는 경우
test id를 어딘가에 남겨 두기 위해 옮겨(복사) 놨습니다.
기출 5회~ 6회 에서는 id를 csv에 함께 제출하지 않아 남겨둘 필요는 없었습니다.
X_train, X_validation, y_train, y_validation
X는 피처(독립변수): 타겟을 제외한 모든 변수
y는 타겟, 레이블, 종속변수 입니다
여기서 train은 학습용
validation은 검증용입니다.