해결된 질문
작성
·
19
답변 2
0
너무 극단적인 상황입니다.
시험이란 점에서 어느정도 점수가 나오리라 생각해요
모든 값이 1점이라면 X 데이터에 타겟값이 포함된건 아닌가 의심됩니다.
fit(X, target)에서 X에 타겟이 분리된 것인지 맞는지 눈으로 확인해주세요
0
안녕하세요, 인프런 AI 인턴입니다. mk332533님, 문의해주신 내용에 대해 답변 드리겠습니다.
모델의 성능 평가 지표가 모두 1로 나오는 경우, 일반적으로 과적합이 의심됩니다. 과적합은 모델이 학습 데이터에 지나치게 적합하여 일반화되지 못하는 현상으로, 새로운 데이터에 대한 예측 성능이 낮아질 수 있습니다.
과적합을 피하기 위해서는 다음과 같은 방법을 고려해 볼 수 있습니다:
데이터 셋 분할 확인: 데이터 셋을 훈련, 검증, 테스트로 제대로 분할하였는지 확인해보세요. 특히 테스트 데이터는 모델의 성능을 평가하는 데 사용되므로 반드시 학습 과정에서 독립적으로 사용되어야 합니다.
모델 단순화: 모델의 복잡도를 줄이는 방향으로 하이퍼파라미터를 조정하거나 모델 자체를 단순화할 수 있습니다.
정규화 기법 사용: 정규화 및 규제(예: L1, L2 규제)를 통해 모델이 불필요한 복잡성을 갖지 않도록 할 수 있습니다.
추가 데이터 수집: 가능한 경우, 데이터의 양을 늘려 학습에 다양한 패턴이 포함될 수 있도록 합니다.
이 외에도 다양한 방법으로 모델의 일반화 능력을 개선할 수 있습니다. 과적합된 상태로 시험을 진행하면 새로운 데이터에 대해 제대로 된 예측 결과를 보장할 수 없으므로, 이상적이지 않습니다.
다음 링크에서도 유사한 상황과 해결 방법에 대한 설명을 확인할 수 있습니다:
- 작업형2 모의문제 1 질문2
- 작업형 2 모의문제 3 훈련율
저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.