这四个概念之前一直混淆着我,今天好好地梳理一遍,通过一个简单的二分类问题给出各自的解释
先给出各自的定义:
错误率:指分类错误的样本数占样本总数的比例,对于样本集D,定位错误率为:
准确率accuracy:分类正确的样本数占样本总数的比例
精确率(查准率)precision:表示被分为正例的个数中实际为正例的比例
召回率(查全率):表示有多少个正例被准确分为了正例
我们用一个二分类的混淆矩阵来表示
真实情况 | 预测结果(正) | 预测结果(反) |
---|---|---|
正 | TP(真正例) | FN(假反例) |
反 | FP(假正例) | TN(真反例) |
错误率:
准确率:
查准率:
召回率: