해결된 질문
작성
·
235
0
안녕하세요, 혹시 작업형2에서 과적합을 계산할 때,
검증데이터 분리 후-> 모델학습 후 -> 아래와 같은 코드로 계산하는 것이 맞을까요?
계속 train과 과적합이 심한데(train_f1= 0.9, test_f1= 0.7).. 실제 데이터셋을 줄 때는 과적합이 나진 않겠죠?
#과적합 평가
# 훈련 세트에서의 예측 및 F1 Score 계산
train_pred = model.predict(x_tr)
train_f1 = roc_auc_score(y_tr, train_pred)
print("Training F1 Score:", train_f1)
# 검증 세트에서의 예측 및 F1 Score 계산
val_pred = model.predict(x_val)
val_f1 = roc_auc_score(y_val, val_pred)
print("Validation F1 Score:", val_f1)
답변 1
0
위 코드 처럼 비교하는 것은 과적합을 판단하는 기준이 아니에요~ 잘못된 방법입니다.
과적합은 validation과 test 예측 결과에 대한 성능 차이를 보고 이야기 합니다.
시험문제에서는 과적합을 판단할 수가 없어요
신경쓰지 마시고, validation 성능이 좋은 방향으로 모델을 만들어주세요!