从宏观上了解机器学习-模型评估与选择2

性能度量

对模型泛化能力的评价标准就是性能度量,在预测任务中,要评估学习器的性能,就是要把学习器预测结果与真实标记进行比较。

回归任务最常用的性能度量是均方误差(公式略),本节下面主要介绍分类任务中常用的性能度量。

错误率与精度

错误率是分类错误的样本占样本总数的比例,精度则是分类正确的样本数占样本总数的比例。

查准率、查全率与F1

WX20201105-141924.png

一般来说,查准率高时,查全率往往偏低,而查全率高时,查准率往往偏低。在很多情形下,我们可根据学习器的预测结果对样本进行排序,排在前面的是学习器认为最可能是正例的样本,按此顺序逐个将样本作为正例进行预测,则每次可以计算出当前的查全率和查准率,以查准率为纵轴、查全率为横轴作图就得到了“P-R曲线”,如下图所示:

WX20201105-142717.png

在进行比较时,若一个学习器的P-R曲线被另一个曲线包住,则可断言后者的性能优于前者。若曲线发生交叉时,比较合理的判据是比较P-R曲线下面积大小,但这个值不易估算,因此出现了平衡点(Break-Event Point,检查BEP),即P=R时的取值。

但BEP还是过于简化了些,更常用的是F1度量:

F1=\frac{2*P*R}{P+R}=\frac{2*TP}{ m+TP-TN}

在一些应用中,对查准率和查全率的重视程度不同,此时可用F1的一般形式——F_\beta,它定义为:

F_\beta = \frac {(1+\beta^2) * P * R}{(\beta^2*P)+R}

\beta=1时退化为标准的F1;\beta >1时查全率有更大的影响,\beta <1时查准率有更大的影响。

ROC和AUC

很多学习器视为测试样本产生一个实值或概率预测,然后将这个预测值与一个分类与之进行比较,若大于阈值则分为正类,否则为反类。ROC全称是“受试者工作特征曲线”,与P-R曲线类似,它是将学习器的预测结果对样例进行排序,按此顺序逐个把样本作为正例预测,每次计算出两个重要量的值,分别以他们为横纵轴作图就得到了ROC曲线,其中,其纵轴是“真正例率(TPR)”,横轴是“假正例率(FPR)”,即:

TPR=\frac{TP}{TP+FN}\\FPR=\frac{FP}{TN+FP}

如下图所示:

WX20201105-145223.png

同样的,若一个学习器的ROC曲线被另一个完全包住,则可断言后者的性能优于前者,若发生交叉,则较为合理的判据是比较ROC曲线下的面积,即AUC(Area Under ROC Curve)

代价敏感错误率和代价曲线

为权衡不同类型错误所造成的不同损失,可为错误赋予“非均等代价”,在非均等代价下,我们所希望的是最小化“总体代价”,且ROC曲线不能直接反映出学习器的期望总体代价,而代价曲线可以,如下图所示:

WX20201105-150020.png

emmmmmm,公式略,想看的可以去翻书.......

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 214,029评论 6 493
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,238评论 3 388
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 159,576评论 0 349
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,214评论 1 287
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,324评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,392评论 1 292
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,416评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,196评论 0 269
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,631评论 1 306
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,919评论 2 328
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,090评论 1 342
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,767评论 4 337
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,410评论 3 322
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,090评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,328评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,952评论 2 365
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,979评论 2 351