인프런 커뮤니티 질문&답변

권효진님의 프로필 이미지
권효진

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

예시문제 작업형2(신 버전)

예시문제 작업형2(신 버전) 모델 학습 질문

해결된 질문

작성

·

45

0

코드 1

image.png

model.fit(train[cols], target)라고 X_val값에 train[cols]을 대입한 걸로 이해했는데,

코드2

image.png

검증용 데이터의 train은 라벨인코더가 된 cols가 포함된 train 값이라 그냥 train으로 적은 건가요?

 

갑자기 헷갈려서 여쭤봅니다 ㅠㅠ,,,..

 

답변 2

0

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

1, 2 둘다 상관없습니다만

일반적으로 전처리 후 사용할 데이터프레임을 trarin에 넣어 두고 코드2와 같이 작성합니다.

1의 경우 주구매상품과 주구매지점을 버렸기 때문에

성능이 다소 낮을 수 있어요

2와 같이 준비 부탁드립니다.

 

혹, 작업형2를 이제 준비한다면

  1. 꿀팁 섹션 - 작업형2 한가지 방법으로 풀기 (기출은 풀리나 예시문제는 풀리지 않음)

  2. 꿀팁 섹션 - 인코딩시 에러가 발생한다면 (예시문제 케이스)

으로 정리해주세요!!!

2일 남았네요 응원합니다.

0

안녕하세요, 인프런 AI 인턴입니다. 권효진님.

질문하신 내용은 모델에 데이터를 넣을 때의 처리 방식에 대한 것으로 이해됩니다. 데이터 프레임에서 열 이름으로 데이터를 선택할 때, train[cols]의 사용은 해당 절차가 이미 cols에 정의된 열만 가져가는 작업이라는 의미가 됩니다.

  1. 훈련 데이터 처리:

    • train[cols]와 같은 표현식은 train 데이터프레임에서 cols에 정의된 특정 열만 선택합니다. 이렇게 선택된 데이터는 지정한 열들만 훈련에 사용된다는 의미입니다.
  2. train_test_split 사용 후:

    • train_test_split 함수는 데이터를 훈련 및 검증 세트로 나눈 후, 일정한 열 기준을 유지합니다. 즉, 처음에 cols로 정의한 열들만이 계속해서 사용됩니다.
    • 따라서, train[cols]라고 명시해 데이터를 다시 지정해 주는 것은 선택사항일 수 있습니다. 실제 학습(훈련)과 예측(validation) 시 특정 열 기준을 잊지 않기 위한 조치일 수도 있습니다.
  3. 문제 이해의 어려움:

    • 만약 이러한 데이터 선택 작업이 헷갈리신다면, train[cols]가 열 이름으로 인해 데이터피처를 선택하는 방식이라는 점을 기본으로 삼아 주시면 도움이 될 것입니다.

다음과 같은 부분이 더 명확해졌길 바랍니다! 질문자님의 경험을 풍부하게 만들기 위해 유사한 상황에서의 지식공유자님의 이전 답변 URL도 함께 참고하시기 바랍니다 예시문제 작업형2 신버전.

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다. 현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏 추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

권효진님의 프로필 이미지
권효진

작성한 질문수

질문하기