登录注册写文章

评价分类器的好坏的几种方法 Precision Recall F1 ROC AUC

环境与方法

评价分类器的好坏的几种方法 Precision Recall F1 ROC AUC

准确率和召回率应用于信息检索InformationRetrieval和文本分类TextClassification

如果我们将一个样本集进行分类，那么结果将会有四种情况：

Classified Positive Classified Negative

Actual Positive TP FN

Actual Negative FP TN

where： TP True Positive

FP False Positive

FN False Negative

TN True Negative

上述表格被称为Confusion Matrix

接下来我们引入三个指标对分类进行评价：

1. 准确率Precision：表示的是预测为正的样本中有多少是真正的正样本。衡量的是检索系统的查准率。P is the number of correctly classified positive examples divided by the total number of examples that are classified as positive.

2. 召回率Recall：表示的是样本的正例中有多少被预测正确了。衡量的是检索系统的查全率。r is the number of correctly classified positive examples divided by the total number of actual positive examples in the test set.

3. F1-Score: 准确率和召回率的综合指标。F1-Score combines precision and recall into one measure.

计算公式如下：

有时考虑到不同的需求，准确率和召回率有不同的权重，我们可以引入F2-Score和F0.5-Score.

接下来是ROC曲线Receive Operating Characteristic Curve和AUC面积Area Under Curve

对于一个混淆矩阵，我们可以计算两个指标，TPR召回率和FPR：

ROC曲线就是以FPR为x轴，TPR为y轴画图得到。

AUC的值是ROC曲线下的面积，面积越大，表示模型分类越精确。一般分类器的AUC值在0.5到1之间，0.5表示区分能力和随机猜测没有区别，1表示模型完美精准。

同时与F1-Score相对应的有G-Mean，是在统计学科中的评价指标：

1. Sensitivity灵敏度： Same as TPR

2. specificity特异度: also called True Negative RateTNR. TNR = TN / (TN + FP)

FPR = 1 - Specificity

最后编辑于：2017.12.11 00:10:27

©著作权归作者所有,转载或内容合作请联系作者
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

推荐阅读更多精彩内容

机器学习之分类性能度量指标 : ROC曲线、AUC值、正确率、召回率
同见博客：http://zhwhong.cn/2017/04/14/ROC-AUC-Precision-Recal...
zhwhong阅读 138,801评论 16赞 186
【转】机器学习模型评价1(Evaluating Machine Learning Models)
博客上看到一篇优秀的翻译文章。文章地址：http://blog.csdn.net/heyongluoyao8/ar...
_CelesteHuang_阅读 5,383评论 0赞 25
分类器性能度量指标之ROC曲线、AUC值
目录大纲混淆矩阵 ROC曲线 AUC值 AUC能拿来干什么总结参考资料概述二分类问题在机器学习中是一个很...
尼小摩阅读 5,381评论 0赞 5
评价模型的常用方法——精确率、召回率、F1 值、ROC、AUC 各自的优缺点是什么？
ref：https://www.zhihu.com/question/30643044/answer/222274...
yz_wang阅读 36,246评论 0赞 14
机器学习性能评估指标汇总
跑完分类模型（Logistic回归、决策树、神经网络等），我们经常面对一大堆模型评估的报表和指标,如ACC、ROC...
Kevin_bin阅读 9,435评论 0赞 8

赞1赞

赞赏

手机看全文