PAL:华为对于广告推荐position bias问题的解决方案

论文地址:https://www.researchgate.net/publication/335771749_PAL_a_position-bias_aware_learning_framework_for_CTR_prediction_in_live_recommender_systems

Position bias普遍存在于点击率预估的任务中。本文对推荐系统中的position bias问题进行了介绍,并以华为的一篇论文为例来讨论消除position bias的方法。

I. 简介

在一个推荐场景中,推荐商品大多以一个列表的形式呈现给用户,如常见的电商、视频、新闻推荐等等。对于用户的一个请求,排序模型会对召回候选集的所有商品进行打分并排序,分数最高的商品集会被展示给用户。这里就有一个position bias的问题,即用户更倾向于点击排名靠前的商品,而且这种倾向和用户真正的兴趣无关。如果对于不同位置上的点击率进行统计,我们可以发现排名靠前的商品点击率最高,如图1所示:


图1 不同位置的CTR统计

这张图反应了position bias在用户点击行为中的影响。这种现象可能会导致用户忽略自己真正感兴趣的商品,而只是点击排名靠前的商品。而用户行为又是构建推荐模型输入的重要特征,因此模型也会学习到用户带有位置偏差的行为,使得在打分的时候无法把用户最感兴趣的商品排到前面。

II. 现有的解决方案

现在工业界对于position的常用处理方法,是在离线训练时把position(以下用pos代替)当做特征加入到模型训练中,让模型可以学习到商品的位置信息;Pos作为一个输入特征一般会与其他feature concat起来,即\boldsymbol x' = [\boldsymbol x, \boldsymbol {pos}],并一起输入到模型中训练。
在online serving时,由于pos特征是取不到的,模型打分时需要对该特征指定一个值,一般会给0,或者其他相同的默认值。这个默认值的选取对模型的最终打分影响很大,可以在离线预测时尝试不同的值,选取最合适的用于online serving。

III. PAL: 用单独的模型来学习position bias

这篇论文对于位置信息的假设如下:
首先,用户会点击某个商品x的概率,取决于两个互相独立的概率:

  • P(seen|x, pos):用户在列表中看到(注意到)这个商品的概率
  • P(y=1|x, pos, seen):用户看到该商品后,会点击的概率。
    其次,论文假设用户看到该商品的概率,只与商品位置有关,与商品本身无关,即
    P(seen|x, pos) = P(seen|pos) \tag1
    并且用户看到该商品后点击的概率,只与商品本身有关,与商品位置无关,即
    P(y=1|x, pos, seen) = P(y=1|x, seen) \tag2

在华为的这篇论文中,使用了两个模型分别学习以上两种概率,如图2所示

图2 PAL模型

模型分为两个部分,左边的模型只用作为输入,用于学习,右边的模型即为正常的CTR预估模型,输入中不包含,用于学习,两个模型的输出结果相乘,使用同一个cross entropy loss来更新。Online serving时只需要使用右边的模型,无需再给赋默认值。论文中对该模型进行线上AB test 3周,效果比II中传统的position bias处理方法提升了3% - 35%的CTR和CVR.

IV. 总结

position bias是推荐模型中普遍存在的问题,本论文不同于现有将位置作为特征训练的方法,而是提出了将用户看到商品和点击商品两个动作拆分的思想,将position bias对点击的影响单独使用一个模型来训练,并将结果作为偏置加在了原有的模型上,更加精细化地学习到了位置信息。这种将postion bias从CTR 预估模型中拆分并单独建模的思想值得借鉴。

参考资料

  1. <<PAL: A Position-bias Aware Learning Framework for CTR Prediction in Live Recommender Systems>>
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 215,539评论 6 497
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,911评论 3 391
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 161,337评论 0 351
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,723评论 1 290
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,795评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,762评论 1 294
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,742评论 3 416
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,508评论 0 271
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,954评论 1 308
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,247评论 2 331
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,404评论 1 345
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,104评论 5 340
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,736评论 3 324
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,352评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,557评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,371评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,292评论 2 352