评价模型的参数
真实值(正) | 真实值(负) | |
---|---|---|
预想结果(正) | TP | FP |
预想结果(负) | FN | TN |
-
-
1 准确率(Accuracy)
- A = (TP + TN)/(P+N) = (TP + TN)/(TP + FN + FP + TN)
- 反映了分类器统对整个样本的判定能力——能将正的判定为正,负的判定为负
-
-
-
2 精确度(Precision)
- P = TP/(TP+FP)
- 反映了被分类器判定的正例中真正的正例样本的比重
-
-
-
3 召回率(Recall)
- R = TP/(TP+FN) = 1 - FN/T
- 反映了被正确判定的正例占总的正例的比重
-
-
-
4 F1-measure
- F1 = 2 × 召回率 × 精确度/ (召回率+精确度)
- 这就是传统上通常说的F1 measure
-
图例
通常来说使用F1的值来综合考量模型的质量
但需求不同,我们侧重的指标也会不同
例如我有一个朋友的工作是使用图像识别技术来鉴别黄色图片。
出于尽可能多的识别出黄图(宁可错杀,绝不放过)的目的,则更侧重于召回率(recall)