해결된 질문
작성
·
143
·
수정됨
답변 2
0
전제조건에서 데이터를 나누라는 말이 있어요
여기서 train과 test를 나줬지만 test에는 gender가 포함되어 있습니다.
정확도를 구하기 위해 이를 별도로 분리 했어요!
분리한 후 예측을 했고
분리된 실제 값과 예측한 값의 정확도를 구하고 오류률을 계산햇어요
0
안녕하세요, 인프런 AI 인턴입니다.
박태준님의 질문은 작업형 3에서 target 변수를 test 데이터셋에서 추출하는 이유에 대한 것입니다. 이는 특정 작업 유형에서 매우 중요한 고려사항일 수 있으며, 데이터 분할, 모델의 훈련 및 평가 방법 등과 밀접한 관련이 있습니다.
작업형 2와 작업형 3에서 target 변수를 추출하는 방식이 다른 까닭은 각 작업 유형의 목적과 데이터 처리 방식에 차이가 있기 때문입니다. 보통 작업형 2에서는 모델을 학습하기 위해 train
데이터셋에서 target
변수(예측하고자 하는 변수)를 분리하여 사용합니다. 이는 모델 학습에 필요한 독립 변수들과 종속 변수를 명확히 구분하기 위함입니다.
반면, 작업형 3에서는 주어진 문제 상황이나 데이터셋의 특성에 따라 test
데이터셋에서 바로 target
변수를 추출하여 사용할 수 있습니다. 이는 test
데이터에 대한 예측값을 생성하고, 이 예측값이 실제 target
값을 얼마나 잘 예측하는지를 평가하기 위함일 수 있습니다. 예를 들어, 주어진 문제에서 정확도, 오류율, 또는 다른 성능 지표를 측정하기 위해 실제 target
값이 필요한 경우가 이에 해당합니다.
작업형 3에서는 모델을 통해 test
데이터에 대한 예측을 진행한 뒤, 이 예측값과 test
데이터에서 추출한 실제 target
값과 비교하여 모델의 성능을 평가합니다. 이 과정에서 target = test.pop('gender')
같은 코드를 사용하여 test
데이터셋에서 직접 target
변수를 분리해내고, 나머지 변수들로 모델을 평가할 때 사용합니다.
이와 유사한 설명을 제공한 기존 답변은 아래 링크를 참조해주세요:
이 링크에서는 test
의 target
이 실제값으로, train 데이터로 만든 모델을 가지고 test
데이터를 예측한 후, 그 예측값의 정확도를 평가하기 위해 실제값을 별도로 저장하는 과정을 설명하고 있습니다. pop()
함수의 사용법과 목적에 대해서도 자세히 설명되어 있습니다.
저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.