推荐系统遇上深度学习(七十)-[阿里]推荐中的个性化重排序

本文介绍的论文是:《Personalized Re-ranking for Recommendation》
下载地址:https://arxiv.org/abs/1904.06813

排序是推荐系统中比较重要的一环,一般通过point-wise的方式对每一个物品计算一个得分,然后进行排序。但这样做只考虑了单个物品与用户之间的相关性,而忽略了物品之间的相互影响。因此本文在排序阶段后设计了一个重排序(Re-ranking)的模块,在考虑物品相关性的情况下对排序结果进行重排,一起来看一下。

1、背景

排序阶段是推荐系统中比较重要的一环,排序的质量直接影响了用户的体验以及平台的收益。排序算法整体可分为point-wise、pair-wise和list-wise。出于性能上的考虑,一般采用point-wise的方法,即对每一个候选物品给出一个评分,基于评分进行排序。这样的做法仅仅考虑了用户和物品之间的关系,而没有考虑排序列表中物品之间的关系。而pair-wise和list-wise的方法尽管将物品对或者物品列表作为整体输入,但也仅仅是尽可能优化损失函数,而并没有从特征空间上显式建模物品间的相互影响。(文中的这句话没有太明白)

一些文章通过建模物品之间的相互影响来对排序阶段给出的排序结果进行微调,这种做法叫做重排序(Re-ranking)。主流的方法是基于RNN的重排序。但是RNN对于建模物品之间的影响有一定的缺陷,如果两个物品相隔较远,它们的相关性并不能很好的刻画。

因此本文提出了一种基于Transformer的重排序结构,相较于RNN,其优势主要体现在两个方面:
1)两个物品的距离不会影响其相关性的计算
2)Transformer是并行计算,编码效率相较于RNN更为高效(RNN一个时刻只能输入一个物品,相当于是串行计算,而Transformer可以同时输入所有物品,是并行计算)

除了使用Transformer之外,本文还有一个值得借鉴的地方就是将用户特征加入了Transformer中,使得重排序更加个性化。接下来就一起看一下阿里是如何进行个性化重排序的。

2、模型介绍

2.1 整体介绍

重排序的整体框架如下图所示:

主要分为三个部分,输入层、编码层和输出层。文中用到的一些符号定义如下:

2.2 输入层

首先,经过排序阶段,我们得到了固定长度的列表S=[i1,i2,...,in],每个物品对应一个特征向量xi,长度为dfeature,此时输入计作E。除此之外,输入层还包含两个部分。

个性化向量Personalized Vector (PV):用户和每一个物品之间都会计算一个个性化向量pvi作为输入,个性化向量通过如下的预训练模型得到:

该模型是一个二分类模型,取最后一个layer的输出作为个性化向量pvi

加入个性化向量之后,输入矩阵E'为:

位置编码信息Position Embedding (PE):与Transformer中固定的编码信息不同,这里的位置编码信息是可以学习,位置编码矩阵和E'大小相同,计作PE,此时模型的输入E''为:

在得到E''之后,经过一个单层的前向网络来进行一定的转换:

上图中等式右边的E应该是E''吧,感觉打错了。

2.3 编码层

编码层是Transformer结构:

有关Transformer,我们之前有篇文章详细介绍过,这里就不再赘述,大家可以参考:https://www.jianshu.com/p/2b0a5541a17c

2.4 输出层

假设第Nx个Transformer encoder block的输出为F(Nx),通过一层全连接神经网络和softmax层得到每个物品的重排序得分score(i)。

并基于交叉熵损失函数来进行模型参数的更新:

3、实验结果

文中使用Precision@k和MAP@k 作为评价指标,两个指标的计算方式如下:

有关推荐系统的评价指标,可以看本系列的第十六篇文章:https://www.jianshu.com/p/665f9f168eff

3.1 线下实验结果

首先,在Yhaoo Letor数据集上使用两个模型得到的最初推荐结果,分别使用不同的模型进行重排序,实验结果如下:

接下来,分析了不同的模型结构所对应的实验结果:

最后,使用真实的电商数据集进行试验,结果如下:

3.2 线上A/B实验结果

线上使用了三个模型进行A/B实验,实验的评价指标包括PV、IPV、CTR和GMV。PV指24小时内店铺内所有页面的浏览总量,可累加。IPV指点击进入宝贝详情页的次数。如果用户看的越多、点击次数越多,也可以一定程度上表示模型排序结果更好。

线上实验结果如下:

4、总结

这篇文章主要介绍通过Transformer对排序结果进行重排序。个人感觉比较创新的点在于如何将Transformer和用户特征进行结合,并提出了一种预训练的模型来得到用户的个性化向量。

但文中并没有给出直接将这个模型应用于排序阶段的效果如何,这一点也是我个人比较好奇的地方,感觉这个模型直接用在排序阶段也可以得到比较好的结果,哈哈。

本文介绍就到这列,可能我的理解还有不到位的地方,欢迎大家一起讨论对这篇文章的理解~

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 213,558评论 6 492
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,002评论 3 387
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 159,036评论 0 349
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,024评论 1 285
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,144评论 6 385
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,255评论 1 292
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,295评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,068评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,478评论 1 305
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,789评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,965评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,649评论 4 336
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,267评论 3 318
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,982评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,223评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,800评论 2 365
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,847评论 2 351

推荐阅读更多精彩内容