准确率,召回率,F值
https://www.zybuluo.com/mingyan926/note/565249
覆盖率
对平台来说的,是希望消除马太效应(两极分化),发掘长尾能力。所以希望推荐的物品更加广泛些,而不仅仅是一些热门。
Paste_Image.png
第一个公式是所有被推荐的商品的数量除以总的商品数量。
第二个公式是用熵来描述的,这里的p(i)是某个商品被推荐的概率,或者推荐某一类商品的概率(i可以是一件商品或者一类商品)。比如平台一共做了一百次推荐,某个商品被推荐了3次,那么就是0.03。
根据熵的性质,H最大是在最不确定的时候,也就是最混乱。也就是说每个商品都有相同的概率被推荐出去的时候,H最大。所以,覆盖率越大,熵越大,就说明每个商品被推荐的概率更均等。
多样性
我们希望对于一次推荐给用户的商品列表应该尽可能的品类丰富,也就是差异性大些。
Paste_Image.png
这里第一个公式表示的是对一个用户的一次推荐过程的推荐列表中的多样性。
假设这次推荐列表一共有n个商品,那我们就要评价下这n个商品的相似程度,评价方法就是看每两个商品的相似度,然后取个平均。
商品两两组合一共有 n(n-1)/2这么多种可能,这就是分母的含义,分子就是两两商品相似度之和(s(I,j)表示两个商品的相似度,具体计算公式后面再说。这样得到的平均结果是相似度的平均,然后再用1减去,得到的就是多样性。
而第二个式子是从整个平台角度来说的,就是把所有推荐列表的多样性取个平均值。U代表所有推荐列表。