基于用户session兴趣的商品推荐算法--DSIN论文解读

0. 写在前面

接着上一篇《DIEN论文解读》来讲讲alibaba最近的一个成果--DSIN(Deep Session Interest Network)深度兴趣会话网络。DSIN是DIEN的升级版,不仅对用户序列进行了更加细致的划分,并且进一步优化了网络架构层数,提高了模型对用户兴趣的表达能力。

个人心得:

  1. 用户的行为序列可以用一个个session序列表示,session内的用户兴趣变化不大;
  2. self-attention用于提取一个session内的用户兴趣

论文地址:
https://arxiv.org/pdf/1905.06482v1.pdf

论文代码:
https://github.com/shenweichen/DeepCTR/tree/v0.8.0

1. 背景

DIN \ DIEN 论文均实现对用户的兴趣进行建模,在实现方式上,两者均采用将用户行为序列中每个独立的物品元素作为一个兴趣点进行建模的方案。然而,在实际场景中,用户在某一个确定的时间段(session)内,兴趣不会发生太大变化。
因此,论文提出了DSIN模型,引入了用户session兴趣,并相对应的实现了兴趣抽取,兴趣演化等一系列建模,通过确定session-->session兴趣抽取-->兴趣交互-->兴趣激活(引入待推荐物品)这个流程来建模,实现最终的推荐。

2. 模型架构

DSIN模型结构如图所示。

image

从图中我们可以看到,左侧是通用部分,在其他模型中也均为此设计,包括用户特征,物品特征,以及上下文特征。不同之处在于右侧对于基于session的用户兴趣的建模设计。这一部分主要分为如下四个部分:

  1. Session Division Layer -- sessioin兴趣划分层
  2. Session Interest Extractor Layer -- session兴趣抽取层
  3. Session Interest Interacting Layer -- sessioin兴趣交互层
  4. Session Interest Activating Layer -- session兴趣激活层

下面详细介绍上述四个模块。

2.1 Session Division Layer

论文以30min为一个session间隔,将用户行为序列中30min以内的物品元素归为一个session,依次间隔类推,进而将整个用户行为序列划分为一个个session。从论文提供的示意图中可以看到,一个session内,用户的兴趣基本没有变化,因此浏览的物品类别也保持一致。

image

2.2 Session Interest Extractor Layer

我们将用户行为序列划分为了一个个session,那么,如何对这个session内用户的兴趣进行建模呢?每个session其本质上都是用户行为序列的一个子序列,而self-attention能够很好的处理序列数据中元素之间的相关性。因此,DSIN使用 Multi-head self-attention来对每个session建模。同时,为了刻画不同session之间的顺序,DSIN引入偏置编码Bias Encoding,实际上是对序列中位置信息的编码。

2.3 Session Interest Interacting Layer

用户会话兴趣抽取层对用户在session内的兴趣进行了建模,考虑到用户的兴趣会随时间发生变化,因此论文在DSIN中设计了一层会话兴趣演化层,用于学习用户的兴趣演化,这与DIEN的兴趣演化建模思路有很强的一致性。与DIEN不同的是,DSIN使用的是双向LSTM对用户的兴趣演化进行建模,如下图所示。

image

LSTM中的隐藏状态被视为结合了上下时刻的用户兴趣,利用LSTM来学习捕捉用户的兴趣变化轨迹。

2.4 Session Interest Activating Layer

上面说到,LSTM学习到了用户兴趣变化的轨迹,然而推荐结果评估的是用户在每个session的兴趣会对当前待推荐物品的偏好产生的影响程度。因此,DSIN引入了会话兴趣激活层,

image

思路也类似于DIEN,将会话兴趣提取层及会话兴趣演化层中每一个兴趣表示向量与待推荐物品进行attention的操作。

image

得到待推荐物品与每个session兴趣的相关程度。进而与物品特征、用户特征及上下文特征进行级联,送入全连接层,得到最终的推荐概率。

3. 效果

论文给出了DSIN与业界主流的推荐模型,如youtubeNet, wide&deep,DIN及DIEN的对比效果。可以看出,相较于其他的模型,DSIN在推荐效果上均有提升。

image

4. 总结

DSIN设计者巧妙的洞察到了用户在一段时间内兴趣不会发生显著变化的事实,继而在DIEN的基础上,加入了session的概念,设计出了DSIN。这说明,对于任何一个推荐场景,都需要算法相关工作人员对其有深刻的理解,并将其理解体现到建模的思路当中,这样方能有方向性的优化模型。另外,DSIN也有许多设计细节值得我们借鉴,例如为每个session添加一个bias enconding来校正每个session中物品位置信息。总之,这篇论文还是值得每个商品推荐算法工程师细细品味。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 218,122评论 6 505
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 93,070评论 3 395
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 164,491评论 0 354
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,636评论 1 293
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,676评论 6 392
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,541评论 1 305
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,292评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,211评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,655评论 1 314
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,846评论 3 336
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,965评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,684评论 5 347
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,295评论 3 329
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,894评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,012评论 1 269
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,126评论 3 370
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,914评论 2 355

推荐阅读更多精彩内容