最近在做检索的课题,接触到了一些之前不那么熟悉的评价指标。
基本评价指标:
准确率P:在返回的结果集中,所需的结果占的比例。
召回率R:返回的所需结果占全数据集中全部所需结果的比例。
AP:AP相比P,加入了排序的概念。因为在实际的检索需求中,我们不仅需要准确率,且需要最相关的内容排列在前面。对于结果返回的一个有序列表,AP计算相应位置上的准确率,然后计算这些准确率的平均值,如果某个位置上返回的结果不相关,准确率为0,如果相关则为1。AP由于位置敏感性便可以更加精确的评价某个检索算法的性能。
mAP: mAP则是对所有查询取个平均值。也就是说AP是针对一个查询的,如果一个查询集是1000个,那么这1000个查询的AP取平均就是mAP了。