登录注册写文章

Interleaving for Ranking Evaluation Online

Interleaving for Ranking Evaluation Online

评估信息检索系统的排序模型，常见的离线评估指标有

precision recall F1-score
NGCG
MAP ERR

常见的线下评估指标有：

CTR / CVR
Time to first click
interleaving

这里主要介绍一种线上比较有效的评估方法balanced interleaving，它的操作过程如下：
假设有两个排序模型，A 和 B，某一结果列表 (a ,b ,c ,d ,e,f)

它们排序序列为 (a ,b ,c ,d ,e ,f) 和（b ,c ,a ,f ,e ,d)
新建一个列表I，以ABABAB...
的顺序，从两列表中顺序选取一个元素添加到I中，并记下列表I中元素的来源。I就是最终展示到用户面前的结果列表
统计I中来自A 和 B 或者 AB 点击或者转化的量, C(A) C(B) C(AB)

计算：
$\delta(AB) = \frac{C(A) + C(AB)*\frac{1}{2}}{C(A)+C(B)+C(AB)} - \frac{1}{2}$

$\delta(AB)$ 大于0表明A WIN B，反之B WIN A，绝对值表示差距大小。

参考：https://www.cs.cornell.edu/people/tj/publications/chapelle_etal_12a.pdf

最后编辑于：2017.12.03 21:21:58

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成，浏览时请结合常识与多方信息审慎甄别。
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

相关阅读更多精彩内容

第一篇文章
迎风吹雪阅读 218评论 0赞 1
所有的服从、听话、乃至表现良好，都出于以下三个原因
小妞的小表哥来了一段时间后，小妞自是很高兴，每天跟在哥哥后面，哪怕小表哥好无聊好无意义的玩耍、喊叫，都会引来小妞的...
驰若谷阅读 892评论 0赞 1

《回家过年》
过年的味道愈来愈浓，回家的盼望种植在天涯游子的心房犹如风筝线头一直拽在故乡母亲手中过年的色彩愈来愈红归...
天涯抱一哥阅读 271评论 0赞 0

友情链接更多精彩内容

赞1赞

赞赏

手机看全文