小结
点击率预估中往往存在点击位置或者平台的bias,一般来说,位置越靠前越可能被点击。在pinterest中不同的平台和位置在点击率上全局来看就存在差异
点击率
所以对点击率进行去偏是一个比较常见的做法。有一种方法就叫COEC。
COEC来源
《Comparing Click Logs and Editorial Labels for Training Query
Rewriting》
4.1节介绍了如何用Expected Clicks来对Clicks进行标准化
具体做法如下:
- 统计每一个位置的全局点击率
- 对于一个集合m,期望的点击为
- COEC的值即为每一个位置上实际的点击除以期望的点击
=
COEC在Pinterest上的应用
如最上方的图所示,pinterest在不同的平台和不同的位置全局点击率是有偏的,所以他们采用了COEC。具体的公式为:
其中,
-
是不同平台p和位置k的全局点击率,
-
是pin_r在请求pin_q的不同平台p和位置k下的曝光次数
不仅仅是点击,对于其他的行为,比如保存、关闭等等,pinterest都进行了类似的操作来标准化