面试的时候回答的不清楚,学习&总结如下。
参考link
1.ROC曲线
对于二值分类器,评价指标主要有precision,recall,F-score(综合考虑precision和recall的调和值)
ROC曲线上的每个点反映着对同一信号刺激的感受性。横坐标FPR越大,预测正类中实际上负类越多。纵坐标TPR越大,预测正类中实际正类越多。所以最好的情况是(0,1)时。
【其他知识点】
混淆矩阵
2.如何画roc曲线
对一个特定的分类器和测试数据集,只能得到一个分类结果。需要一组FPR和TPR的值。
简单来说就是,每个样本根据预测值排好序,然后依次将每个值当做阈值,计算该阈值下的FPR和TPR。
3.AUC的计算
AUC(area under curve)即ROC曲线下的面积。(随机给定一个正样本和一个负样本,分类器输出该正样本为正的那个概率值 比 分类器输出该负样本为正的那个概率值 要大的可能性)