准确率(Accuracy)的局限性
在分类问题中,准确率的定义为:分类正确的样本占总样本个数的比例,即:但是此指标存在缺陷:
当正负样本非常不均衡时,eg:当负样本占99%时,如果分类器把所有的样本都预测成了负样本也可以获得99%的准确率。因此当不同类别的样本比例非常不均衡时,占比大的类别往往成为影响准确率的最主要因素,也就是此时准确率指标并不足以说明分类器的好坏
但是此指标存在缺陷:
当正负样本非常不均衡时,eg:当负样本占99%时,如果分类器把所有的样本都预测成了负样本也可以获得99%的准确率。因此当不同类别的样本比例非常不均衡时,占比大的类别往往成为影响准确率的最主要因素,也就是此时准确率指标并不足以说明分类器的好坏