几个常用的metrics的简单笔记

随手记——几个深度常见metrics

kappa

公式

kappa = \frac {p_o-p_e} {1-p_e}
其中
p_o=\frac {分类正确的样本数} {所有样本数} = (混淆矩阵中的)\frac {对角线元素之和} {所有元素之和}
p_e = \frac {\sum{y_{pred}的第i类样本数 \times y_{true}的第i类样本数}} {(所有样本数)^2} \\ = (混淆矩阵中的) \frac {\sum {第i行元素和 \times 第i列元素和}} {(所有元素之和)^2}

例子

y_true = [2, 0, 1, 2, 0, 1]
y_pred = [0, 0, 2, 2, 0, 2]

根据以上y_true和y_pred构建的混淆矩阵如下

0(y_true) 1(y_true) 2(y_true)
0(y_pred) 2 0 1
1(y_pred) 0 0 0
2(y_pred) 0 2 1

接着计算
p_o=(2+1)/6=\frac {1}{2}p_e=(3\times 2+0\times 2+3\times 2)/(6\times 6)=\frac {1}{3}

最终
kappa = \frac{\frac {1}{2}-\frac {1}{3}}{1-\frac {1}{3}} = 0.25

代码验证

from sklearn.metrics import cohen_kappa_score
kappa_value = cohen_kappa_score(y_true, y_pred)
输出结果 0.250000

设计目的

为了解决类别不平衡问题,kappa依靠p_e在类别越不平衡就越大的特点,使得类别不平衡时kappa分数会更低。

F1-score

回忆基础概念,二分类混淆矩阵中,有这些定义:

  • TP: true positive, 实际为true,预测为positive
  • TN: true negative, 实际为true,预测为negative
  • FP: false positive, 实际为false,预测为positive
  • FN: false negative, 实际为false,预测为negative

在这些的基础上,定义了三个指标:

  • Accuracy: 准确率, \frac {TP+TN}{TP+TN+FP+FN}, 预测分类准确的比例
  • Precision: 精确率, \frac {TP}{TP+FP}, 预测为positive中正确的比例
  • Recall: 召回率, \frac {TP}{TP+TN}, 实际为true中被预测出来的比例

为了综合Precision和Recall,求取两者的调和平均数因为无法直接得知TP+FP和TP+TN的数量,直接用加权平均无法确定合理的权重
F1 = \frac {2*precision*recall}{precision+revall}

Dice

非常奇妙的是,F1-score也被称作Dice similarity coefficient,也就是说他的含义和医学影像分割中常用的Dice是一毛一样的。

Dice一般定义如下:
\text { DiceCoefficient }=\frac{2|X \cap Y|}{|X|+|Y|}
咱们可以“惊讶”地发现,如果把pred(X)和ground-truth(Y)理解为用[0,1]标注的分类(其实这正是语义分割的原始定义,pixel-wise的分类问题 ),可见Dice确实和F1-score是一样的。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 213,558评论 6 492
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,002评论 3 387
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 159,036评论 0 349
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,024评论 1 285
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,144评论 6 385
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,255评论 1 292
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,295评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,068评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,478评论 1 305
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,789评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,965评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,649评论 4 336
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,267评论 3 318
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,982评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,223评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,800评论 2 365
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,847评论 2 351

推荐阅读更多精彩内容

  • 逻辑回归说的是数据的分类,估计的是一个离散值 线性回归用来估计某个连续值,如果用线性回归来归类,预测值是0.1 0...
    Bounty_Hunter阅读 3,229评论 0 1
  • SKlearn的Metrics模块下有有许多二分类算法的评价指标,这里我们主要讨论最常用的几种。 1.准确度(Ac...
    taon阅读 4,594评论 0 6
  • 线性回归** (属于回归算法,解决回归问题,即目标值为连续性的数据) 应用场景:房价预测,销售额度预测,贷款额度预...
    xiaopar阅读 1,544评论 0 1
  • 简介 混淆矩阵是衡量分类模型准确度中最基本、直观,计算最简单的方法。混淆矩阵就是一张表,展示预测值各类归对、归错的...
    RossH阅读 4,587评论 0 3
  • 参考链接:https://baijiahao.baidu.com/s?id=1619821729031070174...
    数据分析成长记阅读 5,849评论 0 2