机器学习指标

TP(True Positive):把正类预测为正类

FP(False Postive):把负类预测为正类

TN(True Negative):把负类预测为负类

FN(False Negative):把正类预测为负类

1.精确率

精确率是指预测为正的样本中有多少是真正的正样本(找出来的正样本有多少是正确的)。

精确率P=TP/(TP+FP)

2.召回率

召回率是指有多少正的样本被正确分类(正样本有多少被找出来了)。

召回率R=TP/(TP+FN)

3.准确率

准确率是指所有样本中被分类正确的比例。

准确率ACC =(TP+TN)/(TP+FP+TN+FN)

4.ROC曲线

受试者工作特征曲线 (receiver operating characteristic curve,简称ROC曲线),roc曲线上每个点反映着对同一信号刺激的感受性。

true positive rate(真阳性率): TPR = TP/(TP+FN)

false positive rate(伪阳性率): FPR = FP/(FP+TN)

直观上,TPR 代表能将正例分对的概率,FPR 代表将负例错分为正例的概率。在 ROC 空间中,每个点的横坐标是 FPR,纵坐标是 TPR,这也就描绘了分类器在 TPR(真正率)和 FPR(假正率)间的 trade-off

ROC曲线的优点:ROC曲线可以无视样本不平衡,当正负样本分布变化的时候,ROC曲线可以保持不变。

5.AUC(Area Under Curve)

Roc曲线下的面积,介于0.1和1之间。AUC作为数值可以直观的评价分类器的好坏,值越大越好。

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

友情链接更多精彩内容