登录注册写文章

2020 机器学习之准确度、精确度和召回率

2020 机器学习之准确度、精确度和召回率

machine_learning.jpg

大家可能更专注模型定义，构建过程和其背后算法，而对如何评价一个模型的好坏还不太了解，不了解各种评估模型的指标，以及他们都代表什么以及如何使用。
其实要训练出一个好的模型，首先要知道什么样模型才是好的模型。这样就需要通过一些指标来真正反映模型好坏。也是今天重点的内容。

真实值\预测值	T	F
T	TP	FN
F	FP	TN

TP(True Positive) 真正类测试集真实标签为 T，预测值也为 T的总数
FN(False Negative) 漏报测试集真实标签为 F，测试集却为 F 的总数
FP(False Positive) 误报测试集真实标签为 F，测试集却为 T 的总数
TN(True Negative) 真负类

准确率

准确率(Accuracy):所有正确分类的样本与总样本数比例
准确度是正确预测和总数的比值，从混淆矩阵中，TP 和 TN 之和就是正确的预测数。
$Acc = \frac{N_{pred} }{N_{total}}$

$N_{pred} = TP + TN$
$N_{total} = TP + TN + FP + FN$

下面的精准度和召回率有点绕，但是并不难只要大家留心然后在自己做点练习就能够很好理解和运用这两个指标来衡量模型。

精准度(Precision)

精准度(Precision):就是我们预测为正样本中有多少是正确的概率
正确类数和真正类数与漏报数之和的比值，
$Precision = \frac{TP}{TP + FP}$

召回率(recall)

也叫查全率，反映正样本被预测为正的比例。
$Recall = \frac{TP}{TP+FN}$
召回率体现了分类模型H对正样本的识别能力，recall 越高，说明模型对正样本的识别能力越强。

假设有 20 任务其中 10 个被按时完成，10 个逾期完成

第 1 种

	预测完成任务	预测逾期完成任务
实际按时完成任务	2	8
实际逾期完成任务	0	10

名称	值
准确率	(2+10)/20 = 0.6
精准度	2/(2+0) = 1
召回率	2/(2+8) = 0.2

第2种预测情况

	预测完成任务	预测逾期完成任务
实际按时完成任务	10	0
实际逾期完成任务	10	0

名称	值
准确率	10/20 = 0.5
精准率	10/(10+10) = 0.5
召回率	10/(2+8) = 1

我们看到虽然召回率是 100% 但是精准率确很低只有 50% 也就是我们在做题时候全部孤注一掷压一个选择。

wechat.jpeg

最后编辑于：2020.01.22 17:19:09

©著作权归作者所有,转载或内容合作请联系作者
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

推荐阅读更多精彩内容

机器学习术语表
机器学习术语表本术语表中列出了一般的机器学习术语和 TensorFlow 专用术语的定义。 A A/B 测试 (...
yalesaleng阅读 2,003评论 0赞 11
谷歌开发者机器学习词汇表：纵览机器学习基本词汇与概念
谷歌开发者机器学习词汇表：纵览机器学习基本词汇与概念姓名：钟航转载自：http://mp.weixin.qq....
XavierZHH阅读 1,983评论 0赞 7
牢记分类指标：准确率、精确率、召回率、F1 score以及ROC
我们倾向于使用准确率，是因为熟悉它的定义，而不是因为它是评估模型的最佳工具！精度（查准率）和召回率（查全率）等指标...
MiracleJQ阅读 61,991评论 1赞 24
【火炉炼AI】机器学习011-分类模型的评估：准确率，精确率，召回率，F1值
【火炉炼AI】机器学习011-分类模型的评估：准确率，精确率，召回率，F1值 (本文所使用的Python库和版本号...
科技老丁哥阅读 8,982评论 8赞 15
机器学习英语词汇--8
本文编译自谷歌开发者机器学习术语表项目，介绍了该项目所有的术语与基本解释。 A 准确率（accuracy）分类模...
630d0109dd74阅读 2,059评论 0赞 1

1赞2赞

赞赏

手机看全文