인프런 커뮤니티 질문&답변

박태준님의 프로필 이미지
박태준

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

7회 기출유형(작업형3) 🆕 updated 2024.4

target = test.pop()

해결된 질문

작성

·

143

·

수정됨

0

작업형 2에서는 target = train.pop('')으로 train데이터에서 target을 추출했는데

 

작업형 3의 오류율 구하는 문제에서는 target = test.pop('gender')으로 test데이터에서 target을 추출한 것 같습니다.

(train에서 추출하면 오류가 발생하긴 하더라구요)

 

작업형 3에서는 왜 target을 test에서 추출하는 건가요?

답변 2

0

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

전제조건에서 데이터를 나누라는 말이 있어요

여기서 train과 test를 나줬지만 test에는 gender가 포함되어 있습니다.

정확도를 구하기 위해 이를 별도로 분리 했어요!

분리한 후 예측을 했고

분리된 실제 값과 예측한 값의 정확도를 구하고 오류률을 계산햇어요

0

안녕하세요, 인프런 AI 인턴입니다.

박태준님의 질문은 작업형 3에서 target 변수를 test 데이터셋에서 추출하는 이유에 대한 것입니다. 이는 특정 작업 유형에서 매우 중요한 고려사항일 수 있으며, 데이터 분할, 모델의 훈련 및 평가 방법 등과 밀접한 관련이 있습니다.

작업형 2와 작업형 3에서 target 변수를 추출하는 방식이 다른 까닭은 각 작업 유형의 목적과 데이터 처리 방식에 차이가 있기 때문입니다. 보통 작업형 2에서는 모델을 학습하기 위해 train 데이터셋에서 target 변수(예측하고자 하는 변수)를 분리하여 사용합니다. 이는 모델 학습에 필요한 독립 변수들과 종속 변수를 명확히 구분하기 위함입니다.

반면, 작업형 3에서는 주어진 문제 상황이나 데이터셋의 특성에 따라 test 데이터셋에서 바로 target 변수를 추출하여 사용할 수 있습니다. 이는 test 데이터에 대한 예측값을 생성하고, 이 예측값이 실제 target 값을 얼마나 잘 예측하는지를 평가하기 위함일 수 있습니다. 예를 들어, 주어진 문제에서 정확도, 오류율, 또는 다른 성능 지표를 측정하기 위해 실제 target 값이 필요한 경우가 이에 해당합니다.

작업형 3에서는 모델을 통해 test 데이터에 대한 예측을 진행한 뒤, 이 예측값과 test 데이터에서 추출한 실제 target 값과 비교하여 모델의 성능을 평가합니다. 이 과정에서 target = test.pop('gender') 같은 코드를 사용하여 test 데이터셋에서 직접 target 변수를 분리해내고, 나머지 변수들로 모델을 평가할 때 사용합니다.

이와 유사한 설명을 제공한 기존 답변은 아래 링크를 참조해주세요:

이 링크에서는 testtarget이 실제값으로, train 데이터로 만든 모델을 가지고 test 데이터를 예측한 후, 그 예측값의 정확도를 평가하기 위해 실제값을 별도로 저장하는 과정을 설명하고 있습니다. pop() 함수의 사용법과 목적에 대해서도 자세히 설명되어 있습니다.

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

박태준님의 프로필 이미지
박태준

작성한 질문수

질문하기