인프런 커뮤니티 질문&답변

yen_nn님의 프로필 이미지
yen_nn

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

작업형2 모의문제1

작업형2 모의문제 질문입니다 !

해결된 질문

작성

·

167

·

수정됨

0

  • 학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!

  • 질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요

  • 먼저 유사한 질문이 있었는지 검색해보세요

1) 작업형2 모의문제1에서 'CLIENTNUM' 컬럼은 왜 삭제되어야 하는건지 이해가 안돼서 질문 드립니다 ! ㅠㅠ

 

2) 데이터 전처리&피처 엔지니어링 과정에서 아래와 같이 문제에서 주어진 값에 대해 train 데이터에서는 id를 삭제하고, test 데이터에서는 복사하는데요 이러한 과정은 왜 train에서는 삭제를 하고 test 데이터는 복사하는건지 잘 이해가 안되네요ㅠㅠ

train = train.drop('id', axis=1)

test_id = test.pop('id')

test.head()

 

3) X_tr, X_val, y_tr, y_val 데이터가 각각 무엇을 의미하는지 헷갈립니다ㅠㅠ 쉬운 설명 부탁드려요ㅠㅠ

 

답변 1

0

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

문제에서 제출 파일에 test_id를 포함해서 csv를 만들어라고 되어 있는 경우

test id를 어딘가에 남겨 두기 위해 옮겨(복사) 놨습니다.

기출 5회~ 6회 에서는 id를 csv에 함께 제출하지 않아 남겨둘 필요는 없었습니다.

 

X_train, X_validation, y_train, y_validation

X는 피처(독립변수): 타겟을 제외한 모든 변수

y는 타겟, 레이블, 종속변수 입니다

 

여기서 train은 학습용

validation은 검증용입니다.

yen_nn님의 프로필 이미지
yen_nn

작성한 질문수

질문하기