机器学习常见评价指标 Common Indicators for Machine Learning

常见的评价指标种类实际较为丰富,但因此也很容易遗忘和疏忽,抽空整理如下:

混淆矩阵 (Confusion Matrix)

事实为真 事实为假
猜测为阳性 TP FP
猜测为阴性 FN TN

混淆矩阵可以作为一个串联其他指标的关键角色,因此首先将其引入,本身四个指标的简称就很容易“混淆”了,不准确记住可不行,这里命名可以很简单的发现由两对元素组成{True,False},{Positive, Negative},其中PN是用来表示预测的结果,即阳性与阴性,而True与False则是用于表示预测相对于事实的对错,因此FN表示猜测为阴性,而猜测又猜错了,因此事实结果与预测相反,为真。 当然2x2只是混淆矩阵的一个特例,高维的情况不再赘述。

准确率(Accuracy)

根据混淆矩阵的表示,可以将我们最熟悉的准确率重新列出如下:
Accuracy= \frac{TP+TN}{TP+TN+FP+FN}
准确率可以算是我们的“启蒙”指标了,可以很直观的评价一个模型的预测结果优劣,但是对于一些特殊情况(例如标签分布即为不均匀等)则表现较差,具有较强的局限性。

精确率&召回率,F_\beta Score

通过混淆矩阵,我们可以对精确率(precision)、召回率(recall) 进行定义:
precision = \frac{TP}{TP+FP}
recall = \frac{TP}{TP+FN}
根据公式,精确率直观表示预测为真且准确的样本占所有预测为真的样本的比例,而召回率表示预测为真且正确的样本占所有真的样本的比例,用来衡量搜索系统的“查全率”。相比之下,精确率反应的是搜索系统的“查准率”,利用二者之间相互制约的关系,可以更全面的对模型的预测进行评价。 在实际使用中需要根据场景需求对二者进行取舍。

而最常见的对召回率与精确率进行综合衡量的指标就是F_\beta score 了, 其表达式如下:
F_\beta = (1+\beta^2)*\frac{precision*recall}{\beta^2*precision+recall}
其中\beta表示了对精确率的重视程度,当大于1时则表现为更加重视精确率,而当小于1时则更加重视召回率。特别的当等于1时,称为平衡F分数(balance F score),也就是十分常用的F1 score:
F_1 = \frac{2*precision*recall}{precision+recall}
相比于准确率,使用F分数可以更全面的衡量模型表现。

ROC&AUC

想必经常看论文的一定对评价指标AUC并不陌生,AUC(Area under Curve),为曲线下面积,而这根曲线就是上文所提到的ROC(Receiver Operating Characteristic curve),中文译为受试者工作特征曲线。 想要解释该曲线的含义我们还是要借助混淆矩阵。除了精确率以及召回率外,我们引入以下两个指标:真阳性率(TPR),假阳性率(FPR)。
TPR = \frac{TP}{TP+FN}
FPR = \frac{FP}{FP+TN}
其中TPR 也称为敏感性,可以发现与上面的召回率表示同一个意思,而FPR则可以更形象地形容为误诊率。
而ROC曲线则是按照以FPR为X轴,TPR为Y轴,不断变换正负样例的判断阈值 t 以获取不同的数据点所画出的曲线。 对于真正例率TPR,分子是得分>t里面正样本的数目,分母是总的正样本数目。 而对于假正例率FPR,分子是得分>t里面负样本的数目,分母是总的负样本数目。由于分母是恒定的,因此TPR与FPR都会随着阈值 t 的减小而不断增大,若二者增长比例相当则表示模型的输出为随机判断,因此ROC曲线多在y=x曲线上方。而一个好的模型,则会更好的分辨二者,从而让TPR的增大速度快于FPR,从而使曲线更陡,因此ROC曲线下的面积也就越大。如下图所示:

ROC_curves

其中左图表示随阈值划分的结果,若TP与TN无混叠则表示模型可以将其完全分出来,从而对于AUC越大。
AUC可以看做随机从正负样本中选取一对正负样本,其中正样本的得分大于负样本的概率,而这种排序能力越强则可以代表模型的效果越好。
除此之外,AUC也属于对正负样例比例不敏感型,因此具有更强的鲁棒性。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 217,277评论 6 503
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,689评论 3 393
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 163,624评论 0 353
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,356评论 1 293
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,402评论 6 392
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,292评论 1 301
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,135评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,992评论 0 275
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,429评论 1 314
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,636评论 3 334
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,785评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,492评论 5 345
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,092评论 3 328
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,723评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,858评论 1 269
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,891评论 2 370
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,713评论 2 354

推荐阅读更多精彩内容