推荐系统论文阅读(四十三)-Comirec:阿里又一篇多兴趣召回的论文

论文:

论文题目:《Controllable Multi-Interest Framework for Recommendation》

论文地址:https://arxiv.org/pdf/2005.09347.pdf

推荐系统中关于用户长短期兴趣建模一直是一个热点问题,而用户的多兴趣召回更是一个更加通用的对用户兴趣建模的方法,我们在之前的mind论文中已经介绍过了如何用胶囊网络来建模用户的多个兴趣点,今天我们来介绍一下阿里跟清华合作的另一篇关于多兴趣召回的文章。

一 、背景

在介绍这个论文之前,我想来给读者们讲讲为什么用户的兴趣需要进行细粒度的划分,这也是我在工作中真实碰到的情况。

用户在一次session或者说一段时间内浏览了一系列物品,这时候会出现两种情况:

1.这个序列中的所有item都是同一类商品/同一个品质的相似商品,这时候我们就认为这个序列是“收敛”的,也就是这个序列中的物品趋于同质化,这时候用户的兴趣就是单点的,这时候对这个序列建模就比较简单了,不管是rnn还是直接用transformer都可以直接建模出用户在这时候的兴趣点。

2.这个序列中出现了不同品类的商品,比如说衣服和裤子和口红同时出现,这时候我们可以认为这个序列是“发散”的,这时候如果用rnn之类的序列建模方法就没那么work了,你可以相信一下,如果把一些杂乱无章的单词随便凑到一个句子中,在用transformer去建模,那么建模出来的vec表达的意思是什么呢?这时候模型就没可解释性,可能你这时候又会说了,深度学习模型只需要关心work不work,不需要关心具体的解释性了,对于这个观点我不置可否。。

回到正题,如果我们碰到了一个杂乱无章的序列,我们斗胆猜测,用户在这时候的兴趣是多点的,这时候如果强行把用户的兴趣全部杂糅到一个向量中,这时候又会出现几个问题:

1.融合的向量需要完整的表达出用户的兴趣就需要把维度设置的很大,这样训练比较困难

2.融合会让信息损失

3.融合的兴趣向量的空间可解释性比较差,我们不知道这个融合的兴趣向量为什么可以检索出top-n个item,也不知道这个融合的向量在哪个空间维度下。

当然,上面的几个问题是我在实践过程中自己碰到的,尤其是第二点,信息损失会带来很大的影响,主要是无论融合的结构无论如何设计都会让一部分信息丢失。

看一个论文中举的例子吧:

我们可以看到用户的点击序列是发散的,也就是用户浏览的物品都是不相似的,这时候如果我们用多兴趣召回的方法,就可以自动的把用户的多点兴趣建模出来,然后分别去检索出每个兴趣点的物品。

基于以上的背景介绍和分析,我们直接就来开始介绍这篇论文吧。

二 、Comirec模型

模型的总体结构如下:

这篇文章主要采用了两种方法来建模用户的多兴趣,分别是动态路由算法还有self-attention算法。

我们先来看看一些概念吧:

2.1 Dynamic Routing

动态路由算法我们在mind那篇文章里面已经讲过了,今天进不打算详细介绍来,主要讲一下大体的公式。


其中W是映射矩阵,ei是序列中item i的embedding向量

其中:

而这里b_{ij} 是每次动态改变的,初始化为全0。

最后我们得到用户的兴趣向量:

直接看算法的流程更好:

这个跟我们之前介绍mind的方法基本一样,除了对bij的初始化不一样,mind是用正态分布去初始化的。

这里K跟mind也不一样,mind中是动态的,而这里是超参数。

2.2 Self-Attentive Method

这个就更简单,selft-attention嘛,只要熟悉transformer的都知道,但是这里又不是trm中的self-attention方法,相比还更为简单:

其中H是n✖️d,n是序列的长度,也就是序列中的embedding的堆叠。

这里,为了弄出K个兴趣向量,把上式改成:

Vu就建模到了K个兴趣向量了。

比起上面的动态路由算法更为简单了。

3.3 Model Training

这部分没啥好说的咯,还是一样的负采样+交叉熵/极大似然:

serving就跟传统的knn一样就行,faiss直接存储item 向量,然后动态生成K个user的兴趣向量去检索,有点多路召回+粗排的意思。

2.3 Aggregation Module

论文为了表现推荐的精准性和多样性的平衡,引入了一个方法,我直接贴公式了,因为这部分我不是很赞同:

具体的过程如下:

其中N是每个兴趣向量去检索的item个数,M表示这K*N个物品,一共检索出K*N个item,这时候我们从这K*N个item中去选出top-N个物品,为了保持精确性和多样性的平衡,我们使用:使用一个值函数Q(u,S)通过可控因子\lambda 「平衡推荐的准确性和多样性」。

其中g(i,j)是一个多样性或差异性的函数:

其中CATE(i)表示物品 i的类别, \delta 是一个指示函数。

如果想要最大的准确率,那么可以令 \lambda = 0,如果想要最大的多样性,可以令 \lambda = \propto 。文章提出了一个「贪心推理算法」来近似最大化值函数 :

其实这部分的内容我是不赞同的,因为这相当于把多路召回+排序的任务给干了,一般情况下,整个推荐系统都有很多路召回,每路召回都各司其职就好了,也就是说每一路召回尽量不同质化,只需要在自己这条路上进行精益求精的工作,也就是说让模型的精确性提升就好了,而多样性指标让排序去解决就好了。

再者,假如召回把排序的事情做好了,那么即使召回把多样性搞的特别好,但是我觉得效果也不会很好,因为其他路召回也可以补充这些多样性,而且排序模型也会进行重新排序跟混排的,所以这个部分我觉得有点多此一举了。。

三、实验



这篇文章就介绍到这里了,其实有一些关于胶囊网络为什么可以将用户兴趣切分的这么细致,我还是有点没理解清晰的,我理解的是一个动态k-means的过程,但是又说不出来这个感觉,等我后面在看看这个,欢迎私信交流这个问题。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 213,864评论 6 494
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,175评论 3 387
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 159,401评论 0 349
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,170评论 1 286
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,276评论 6 385
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,364评论 1 292
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,401评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,179评论 0 269
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,604评论 1 306
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,902评论 2 328
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,070评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,751评论 4 337
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,380评论 3 319
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,077评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,312评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,924评论 2 365
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,957评论 2 351

推荐阅读更多精彩内容