인프런 커뮤니티 질문&답변

jnood님의 프로필 이미지
jnood

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

예시문제 작업형2(구 버전): 학습시간 최소화를 위해 구 버전은 삭제하고 있어요!

작업형 유형 2 전처리할 떄 id 삭제하는 이유가 뭔지 궁금합니다.

해결된 질문

작성

·

447

0

작업형 유형 2 전처리할 떄 id 삭제하는 이유가 뭔지 궁금합니다.

# id 삭제함 (단 test의 id값은 csv파일을 생성할 때 필요함으로 옮겨 놓음) X_train=X_train.drop(['cust_id'], axis=1) cust_id=X_test.pop('cust_id')

만약 id값을 삭제하지 않고 실행해도 문제가 없을까요?

실제 시험에서 어떤 값을 삭제하고 test에서 pop해야하는 지 판단 기준이 궁금합니다..!

답변 1

1

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

학습(training)할 때 id 값은 필요가 없어서 삭제했습니다. 하지만 이 부분이 어렵다면 id 값을 그대로 두고 진행해도 됩니다. 모델이 알아서 중요도가 낮은 컬럼으로 인식해요!
id는 고유값이고 100개의 행이 있다면 모두 id가 다릅니다. 예측에 크게 도움이 되지 않습니다
test의 id를 다른 변수에 담아둔 이유는 최종 결과 제출 형태 때문입니다. id와 예측값을 csv파일로 만들기 위해서는 id를 어딘가에는 저장해 둘 필요가 있습니다.

  • 2~4회 시험에서는 id값과 예측값을 제출하라고 했고 -> 이때는 반드시 id값을 기억하고 있어야 합니다.

  • 5회에서는 id값 없이 예측값만 제출하라고 했어요! -> 이때는 필요가 없습니다.

jnood님의 프로필 이미지
jnood

작성한 질문수

질문하기