文章名称
【KDD-2020】【Arizona State University-Etsy Inc.】Debiasing Grid-based Product Search in E-commerce
核心要点
文章旨在将ULTR应用到E-commerce的场景,解决原有(检索场景中提出的)方法的两个问题。1)在E-commerce推荐结果不是单列瀑布流而是两列或多列grid-based layout;2)E-commerce中存在多个不同的隐式反馈信息,包括点击和购买(转化),原检索场景方法无法适用或没法充分利用这些信息。作者首先提出了一个通用框架来利用多种隐式反馈信息,同时提出了俩种点击模型,row skipping和slow decay,来估计propensity。
上一节,讲解了作者建模多种隐式反馈的方法,这一节讲解两个点击模型row skipping和slow decay,以及如何在grid-based场景下估计propensity。
方法细节
问题引入
[4]中展示了3种在grid-based的场景中的现象,
- 跳过行
- 注意力降低的比较慢
- 中间位置偏差
基于上述发现,作者提出row skipping和slower decay两种点击模型来估计propensity,以此表示grid-based场景的偏差特性。下图展示了返回结果top16个位置的NCTR和NPR(N指的是用所有的地方的CTR除以第一个位置的CTR做了归一化),作者在数据集中发现的NCTR和NPR的一些特性。
具体做法
Row Skipping
从图2.a中可以看出,NCTR和NPR并不是单调下降的,最右侧最后一个位置的NCTR高于左侧倒数第二行的点击率(作者原文说的是第四行最后一个位置,没明白)。基于这个观察结果,假设表示第
个物品所处的行数,可以利用row skipping级联模型来量化propensity,量化公式如下图所示。
表示当前行被跳过的可能性(作者称之为趋势),
分别表示在第
行之前的物品数量和第
行之内的物品数量。row skipping背后的逻辑是,用户既然观察到了物品
,那么一定经历过了之前的行(无论是审视了还是跳过了)。跳过则用
的连续乘积表示,未跳过则代表用户看完其中一行的商品还决定继续看下一行,用
表示。
值得注意的是,Middle bias之所以没有被考虑,是因为作者的场景列并不多,中间列被忽略的概率不高。
Slower Decay
如前所述,在grid-based场景下,用户的注意力的下降速度要比在list-based场景缓慢。因此,作者构建了来表示缓慢衰减的系数,当
的时候,Slower Decay就退化成了[4]中的cascade model。Slower Decay的整体公式如下图所示。
作者建议,根据实际情况,调整Propensity的模型,并根据实验来确定Propensity。
OPTIMIZATION
在学习模型参数的过程中,作者把Propensity的参数当做超参数,通过grid search来寻找合适的解...获得这些超参数之后,可以计算出Propensity,并带入到如下图所示的
(上节介绍过的损失函数)中求解最优的排序模型。
作者采用LambdaMART[3]来学习排序模型,并计算lambda gradient[1]。为了实现ULTR,作者借鉴[2]的经验在lambda gradient中引入IPW。并且,为了同时利用多种类型的隐式反馈数据,采用如下图所示的公式,扩展了lambda gradient。
其中,表示给定查询
时,物品
所处的位置是
。
的定义如下图所示,
表示如果物品
交换位置,排序指标,如NDCG@K会发生的变化值。
心得体会
Propensity
个人感觉,本文可以理解为在特殊场景(grid-based)场景下的一些尝试和trick,但并不是通用的模型。所以,感觉并不一定能够直接套用到我们的现有场景,只是给一些输入。感觉这些设计最终都需要实验来验证分布是否符合模型假设,因此迁移和探索的成本比较高。
比较令人尴尬的是,作者用grid search来寻找Propensity的参数...
文章引用
[1] Christopher JC Burges. 2010. From ranknet to lambdarank to lambdamart: An overview. Learning 11, 23-581 (2010), 81.
[2] Ziniu Hu, Yang Wang, Qu Peng, and Hang Li. 2019. Unbiased LambdaMART: An Unbiased Pairwise Learning-to-Rank Algorithm. In The World Wide Web Conference. ACM, 2830–2836.
[3] Qiang Wu, Christopher JC Burges, Krysta M Svore, and Jianfeng Gao. 2010. Adapting boosting for information retrieval measures. Information Retrieval 13, 3 (2010), 254–270.
[4] Xiaohui Xie, Jiaxin Mao, Yiqun Liu, Maarten de Rijke, Yunqiu Shao, Zixin Ye, Min Zhang, and Shaoping Ma. 2019. Grid-based Evaluation Metrics for Web Image Search. (2019).