TP(True Positive):把正类预测为正类
FP(False Postive):把负类预测为正类
TN(True Negative):把负类预测为负类
FN(False Negative):把正类预测为负类
1.精确率
精确率是指预测为正的样本中有多少是真正的正样本(找出来的正样本有多少是正确的)。
精确率P=TP/(TP+FP)
2.召回率
召回率是指有多少正的样本被正确分类(正样本有多少被找出来了)。
召回率R=TP/(TP+FN)
3.准确率
准确率是指所有样本中被分类正确的比例。
准确率ACC =(TP+TN)/(TP+FP+TN+FN)
4.ROC曲线
受试者工作特征曲线 (receiver operating characteristic curve,简称ROC曲线),roc曲线上每个点反映着对同一信号刺激的感受性。
true positive rate(真阳性率): TPR = TP/(TP+FN)
false positive rate(伪阳性率): FPR = FP/(FP+TN)
直观上,TPR 代表能将正例分对的概率,FPR 代表将负例错分为正例的概率。在 ROC 空间中,每个点的横坐标是 FPR,纵坐标是 TPR,这也就描绘了分类器在 TPR(真正率)和 FPR(假正率)间的 trade-off
ROC曲线的优点:ROC曲线可以无视样本不平衡,当正负样本分布变化的时候,ROC曲线可以保持不变。
5.AUC(Area Under Curve)
Roc曲线下的面积,介于0.1和1之间。AUC作为数值可以直观的评价分类器的好坏,值越大越好。