机器学习中的性能度量指标汇总


Class Content
layout post
title 机器学习中的性能度量指标汇总
categories Blog
description 对机器学习中常用的度量模型的指标进行汇总,并对其附上代码便于以后使用
keywords 错误率和精度、查准率、查全率、F值、ROC和AUC

前言

在机器学习中要考察选择模型的优劣,需要对模型的泛化能力进行评估,这就是性能度量。本篇文章主要介绍分类、回归以及聚类中的性能度量以及编写代码以便于以后使用。

分类任务常用的性能度量

  • 1. 错误率和精度
    顾名思义,错误率是指分类错误的样本占总样本的比例,精度则是分类正确的样本占样本总数的比例
    错误率表示为:error(f;D)=\frac{1}{N}\sum_{i=0}^{N}I(f(x_i)\neq y_i)精度表示为:acc(f;D)=\frac{1}{N}\sum_{i=0}^{N}I(f(x_i)=y_i)其中I为指示函数,满足要求则为1,不满足为0,且error=1-acc
    更一般的,对于数据分布D和概率密度p(.)
    错误率表示为:error(f;D)=\int_{x \in D}I(f(x)\neq y)p(x)dx精度表示为:acc(f;D)=\int_{x \in D}I(f(x)=y)p(x)dx
    实现代码:

  • 2. 召回率Recall、准确率Precision、F值
    单纯靠错误率和精度衡量模型的是远远不够的,在分类中常用Recall、Precision以及F值去度量模型,如下图二分类混淆矩阵,将召回率和准确率以及F值定义如下:

    图1. 二分类混淆矩阵

    Precision表示为:P=\frac{TP}{TP+FP}
    Recall表示为:R=\frac{TP}{TP+FN}
    F值是召回率和准确率的调和平均值,表示为:\frac{2}{F}=\frac{1}{P}+\frac{1}{R}即F值表示为:F=\frac{2TP}{2TP+FP+FN}=\frac{2*P*R}{P+R}
    下图是样本总体上的查全率、查准率,当前一个学习器的P-R曲线被另外的学习器完全包住时,则说明后一个学习器性能更优,如果发生交叉,则不能断言。
    PR曲线

    平衡点(BEP)即查全率=查准率时。平衡点相对更为简单,所以使用F1值或者加权调和平均。
    加权调和平均定义为:F_\alpha=\frac{(1+\alpha^2)*P*R}{(\alpha^2*P)+R}
    \alpha=1标准F1,\alpha>1查全率有更大影响,\alpha<1查准率有更大影响
    补充:
    在n个二分类混淆矩阵上综合考察查全率查准率有两种方式:
    1。宏查准率、宏查全率、宏F1
    先在各混淆矩阵上分别计算出查准率和查全率记为(P_1,R_1),(P_2,R_2),...,(P_n,R_n)
    macro_P=\frac{1}{n}\sum\limits_{i=1}^{n}P_i
    macro_R=\frac{1}{n}\sum\limits_{i=1}^{n}R_i
    macro_F1==\frac{2*macro_P*macro_R}{macro_P+macro_R}
    2。微查准率、微查全率、微F1
    将各个混淆矩阵的对应元素进行平均,得到TP/FP/TN/FN的平均值\hat{TP}/\hat{FP}/\hat{TN}/\hat{FN},再计算微查全率、微查准率和微F1。

  • 3. ROU与AUC
    ROU(Receiver Operating Characteristic,受试者工作特征)
    很多学习器是为了测试样本产生一个实值或概率预测,然后将这个预测值与分类器阈值比较,大于阈值则分为正类,否则为反类。在不同的分类任务中,根据需求采取不同的阈值,对所有测试样本进行排序,采用不同的截断点(就是阈值),例如更重视查准率,排序位置靠前截断,更重视查准率,排序位置靠后截断。
    ROC曲线的纵轴是“真正例率”(TPR)也称为灵敏度,横轴是“假正例率”(FPR)也称为1-特异度
    TPR=\frac{TP}{TP+FN}
    FPR=\frac{FP}{TN+FP}

    ROC曲线与AUC示意图

    与PR曲线相似,如果ROC曲线完全被另外学习器的曲线包住,则另外学习器的性能更优,如果交叉则不能判定。如果需要继续进行比较,可以使用曲线下的面积,即AUC(Area Under ROC Curve)
    ROC曲线的优点是能够尽量降低不同测试集带来的干扰,更加客观地衡量模型本身的性能
    PR曲线与ROC的使用场合:
    如果没有数据不均衡,倾向于用ROC;
    如正样本远小于负样本,PR更敏感,因为用到了precision=(TP/(TP+FP)),所以应该用PRC.
    正样本远大于负样本,PRC和ROC差别不大,都不敏感

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 194,457评论 5 459
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 81,837评论 2 371
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 141,696评论 0 319
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 52,183评论 1 263
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 61,057评论 4 355
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 46,105评论 1 272
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 36,520评论 3 381
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 35,211评论 0 253
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 39,482评论 1 290
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 34,574评论 2 309
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 36,353评论 1 326
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 32,213评论 3 312
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 37,576评论 3 298
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 28,897评论 0 17
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,174评论 1 250
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 41,489评论 2 341
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 40,683评论 2 335