文章名称
【SIGIR-2021】【University of Illinois at Chicago】Propensity-Independent Bias Recovery in Offline Learning-to-Rank Systems
核心要点
文章旨在同时解决LTR中的Position Bias和Selection Bias,提出了两阶段的bivariate method,在不依赖Propensity Score的情况下,同时纠正上述两种偏差。
上一节介绍了问题的场景以及现有方法存在的缺点。这一节,讲解怎么解决无法观测到用户是否审视到物品以及查询-物品相关性的问题。
方法细节
问题引入
上一节到最后,推导出了点击反事实的公式。同其他场景一样,在公式里需要我们同时估计查询-物品的相关性,同时估计物品被观测到的概率。这一点会导致模型得到次优解。
因此作者构建了问题的因果图,从点击生成的角度,另辟蹊径,矫正偏差,并验证counterfactual的可识别性。
具体做法
Causal Model
作者构建的因果图,如下图所示。其中表示物品是否进入结果集(被展示给用户,英文单词应该是Show),
分别表示物品是否被观测到,是否被点击。
是就是Top-K中的K,排序在K之后的物品不会被展示,即
。
表示物品
与查询
的真实相关性(也就是我们说的位置的相关性)。
图中是我们上一节介绍的查询和物品元组的特征,其中,浅色圆圈的部分是我们需要估计的两个随机变量,物品被观测到的概率以及物品与查询的相关性。可以看出,查询和物品元组的特征同时决定了排序和物品的点击(相关性是mediator)。我们关心的是物品在被观测到的时候,被点击的概率(个人理解是把
当做treatment,把
当做outcome,过程中
都是backdoor path上的变量)。这种情况下,如果我们同时观测到
,那么可以满足后门准则,由于
我们无法实际观测,只能利用
来近似。那么,可以得到如下图所示的因果模型。
即便在上做了近似,仍然需要在所有
的组合上求和(做边缘化),显然是不现实的。此外,不仅仅
不知道,我们实际上也不知道
,还得退而求其次,控制
。
PIJD
前面讲到作者为了避开Propensity Score估计困难这个问题,采用了Two-stage bivariate selection model。这个模型源于经济学[1],用来消除选择性偏差,[21, 35]把这个模型引入排序模型学习,消除选择性偏差,但并没有用来联合消除Position Bias和Selection Bias。
经济学经常用到的是回归方程,顺着这个思路,最简单直接的点击模型如下图所示(其实就是简单的线性回归)。如果没有偏差,这个模型是合理的、有效的。在有偏差的场景,通常采用Two-stage bivariate model来纠正偏差。
基于两阶段模型,作者提出的PIJD的第一阶段如下图所示。采用Probit模型建模物品被观测的过程(被观测的概率),是模型的特征(输入),
建模了排序位置对物品是否被观测到的影响,
表示随机噪声,
是Probit模型的参数。由于不知道
,因此采用
代替。
随后,利用估计的参数来计算每个查询-物品元组的Inverse Mills Ratio (IMR)。计算公式如下图所示。
其中分别表示物品被观测到的概率密度函数以及正态分布的累计概率密度函数。直觉上,这个比率意味着,文档
在当前查询-物品元组下被用户审视到的概率与在所有查询下被审视到的概率累计值的比率。由于,这个比率计算了所有文档,包括被点击的样本和未被点击的样本,因此并不会像只基于点击数据的Propensity Score受到用户行为的影响(因为,点击是用户控制的)。(这里,作者采用IMR进行了审视概率的相对比率计算,文中提到这种方式相当于控制了审视概率,但其实没有讲的特别细致)。
第二阶段,把IMR带入到回归方程中,相当于添加了一个矫正项(从机器学习的角度,也可以被视为正则项吧)。这个矫正项因为引入了未被点击的数据,考虑到了物品被截断,以及位置偏差等,因此纠正了Position Bias和Selection Bias。最终,利用这个回归方程在点击数据上训练,用来估计给定查询下,某个物品的点击率
。
心得体会
Two-stage bivariate model
作者解决选择性偏差的方法来源于经济学中的线性回归纠偏方法,并且常用的Probit模型建模了Selection Bias。其实,计量经济可以说是因果推断的发祥地之一,很多里边的方法都可以被应用于现有因果推断的场景,只不过相对门槛更高一些(相对于我来说T.T),比如influence function。感兴趣的同学,可以详细读一下文章第三节的最后两段,参考[1]里的解释,理解一下背后的原理,共勉!
文章引用
[1] James Heckman. 1979. Sample Selection Bias as a Specification Error. Econometrica 47, 1 (1979), 153–161
[2] Zohreh Ovaisi, Ragib Ahsan, Yifan Zhang, Kathryn Vasilaky, and Elena Zheleva. 2020. Correcting for Selection Bias in Learning-to-rank Systems. In Proceedings of the 29th International Conference on World Wide Web. 1863–1873.
[3] Yixin Wang, Dawen Liang, Laurent Charlin, and David M Blei. 2020. Causal Inference for Recommender Systems. In Proceedings of the 14th ACM Conference on Recommender Systems