작성
·
294
0
선생님 강의 덕분에 빅데이터 분야를 좀 더 효율적이게 공부할수 있어서 감사드립니다.
다름이 아니라 precisions, recalls, thresholds = precision_recall_curve(y_test, pred_proba_class1 ) 에서
임계값에 따른 precisions, recalls 이 반환 된다고 하셨는데 그렇다면 반환될때 threshold 갯수와 precisions, recalls의 개수가 같아야하지 않나요? 즉 threshold가 143개이면 그에따라서 rcalls와 precisions의 개수도 143개가 되야하는거 아닌가요? 왜 threshold가 143개일때 recalls와 precisions의 개수가 144개 인지 잘모르겠습니다
답변 1
1
안녕하십니까,
precision_recall_curve에서 precision과 recall은 threshold보다 1개가 더 있습니다. precision의 경우 마지막 원소가 1, recall의 경우 마지막 원소가 0 입니다.
아래 API 설명을 참조하시면 좋을 것 같습니다.
https://scikit-learn.org/stable/modules/generated/sklearn.metrics.precision_recall_curve.html
감사합니다.