推荐系统论文阅读(三十四)-京东:解耦可替代性和互补性的DecGCN

论文:

论文题目:

《Decoupled Graph Convolution Network for Inferring  Substitutable and Complementary Items 》

论文地址:https://www.researchgate.net/publication/344752305_Decoupled_Graph_Convolution_Network_for_Inferring_Substitutable_and_Complementary_Items

这是一篇由京东发表在CIKM2020上面关于如何解耦商品可替代性以及互补性的图神经网络文章,该论文是第一篇将这两个属性利用两个不同的图结构建模的文章,同时在利用对方的结构以及语义进行互补,更好的建模了item的可替代性和互补性这两个在电商领域只为重要的特征。

一 、背景

在电商领域中商品有两个很重要的属性,可替代性(substitutable)和互补性(complementary),这两个属性在推荐系统里面发挥着重要的作用,可以建模商品之间的关系,从而给用户生成候选物品,关于这两个属性,可以用以下两个例子来举例。

用户在浏览网站的时候,假如他/她最后购买的是一件t-shirt,那么他/她在购买这件t-shirt之前一定是浏览过很多其他的t-shirt的,这些其他t-shirt就是她最终购买的这件t-shirt的可替代性item。

用户在购买来一件t-shirt后,通常会购买一条可以跟这件衣服搭配的牛仔裤,这条牛仔裤就是这件t-shirt的互补item。

了解完item的这两个属性后,我们来思考一下,如果要对这两个属性进行表征学习,一般的方法是同时对这两个表征学习,把这两个属性映射到同一个空间里面,共同作为item的embedding表示。

我们知道item之间的关系是复杂多样的,item之间这种存在多种不同关系的结构可以定义成item的异质图结构,可替代性和互补性是item的两种不同方面的属性,如果在同一个空间里对这两个属性进行表征学习就会有几个问题:

1.将item的可替代性和互补性简单地融合在一个共享的embedding中是不鲁棒且有噪声的。

2.直观地说,一个物品的补充信息也可以提供关于它的可替代性的重要线索,反之亦然。例如,如果两件t恤是可替换的,即有相似的风格和尺寸,他们可能有许多共同的互补项目(如牛仔裤)。

所以我们在建模表征学习的时候需要将这两个item的属性进行图结构上的解耦和语义上的解耦,当然解耦不是简单的将两部分的东西完全分离,前面也说了这两个属性也是可以作为彼此的信息补充,所以在表征的时候会充分利用这两部分信息。

这篇论文会从结构和语义两个阶段来阐述可替代性和互补性是如何表征学习的,更具体的细节我们接着往下看吧。

二、问题描述和定义


2.1 Heterogeneous Graph(异质图)

我们用异质图表示item之间具有多种不同关系的图结构,G = (V, E),V是节点的集合,E是边的集合,在这篇论文里面E= E^{(s)} \cup E^{(c)} ,其中E^{(s)} 谁可替代性关系的边,E^{(c)} 是互补性关系的边。节点的属性集合为X = {x1, x2, ..., x𝑛}。

由于我们考虑了两种不同的边,所以可以把整个图看成是两个子图,一个子图表示的是可替代关系的图,G^{(s)}  = (V, E^{(s)} ),另一个是互补性的图,G^{(c)}  = (V, E^{(c)} )。

2.2 Problem Definition(问题定义)

由于我们把关系限定在了可替代性和互补性之内,所以我们就需要把这两个属性的embedding都表征出来:

当然,我们得到这两种embedding后还是需要定义出怎么来生成候选集的:


p^{(s)} 表示i和j是可替代物品的概率,p^{(c)} 表示i和j是可互补物品的概率。


三、模型结构



3.1 Graph Convolutional Network

这部分主要讲一下本论文采用的图神经网络结构用的图卷积的方式是GraphSage这篇文章采用的方法,具体的细节我们已经在第27篇文章里面讲过了,想了解的可以去看一下,或者看一下原文,这里就不在阐述了:


3.2 Overview of Decoupled GCN

对比那些把这两部分融合在一起的结构,本文将两部分属性解耦了,这么做可以更灵活地建模复杂的替代和补充关系。

我们在之前也说过了,虽然需要把这两部分属性解耦建模学习,但是这里的解耦学习的意思是分别学习出各自的embedding,在学习的过程中仍然需要将这两部分的结构和语义信息互相补充来学习embedding。

为了结合这两部分的信息,文中采用了两阶段学习的方式:structural integration和semantic integration,下面我们来讲解下这两个阶段的学习方法。

3.2.1 structural integration

结构聚合,就是在建模一个sub-graph结构的时候要利用另一个结构的,具体而言,我们把上面的方法改写成:

另一个子图的结构跟节点的特征X一起作为条件给出了,下面我们以如何建模学习可替代性的embedding出发讲解,另一个也一样就不再具体详细解说了。

3.2.2 Semantic integration.

之前也提到了,我们是两阶段建模的过程,所以这部分是在structural integration学习到的embedding基础上学习的:

这个阶段跟上面阶段不一样的地方在于,structural integration用的是另一部分的结构信息,但是学习过程中的embedding还是自己的,而这部分的学习是直接利用到了对方的embedding信息。

接下来我们要详细讲解这两个阶段的细节。

3.3 Structural Integration: Multifaceted Co-Attentive Neighborhood Aggregation


我们先不谈具体的符号定义,单看这个结构,很容易就能看出具体的集成过程,正如图结构里面所画出来的计算定义一样,实际上的运算也是这么简单易懂。

我们先来给出几个定义:

H_{s}^{(s)} \in  R^{ |N_{i}^{(s)}| \times d } ,其中N_{i}^{(s)}是 节点i在可替代结构子图中的邻居节点

H_{c}^{(s)} \in R^{ |N_{i}^{(c)}| \times d } ,其中N_{i}^{(c)}是节点i在互补结构子图中的邻居节点

这两部分的的意思就是将邻居节点的embedding堆叠起来的意思,注意一下,这里只有结构上定义的邻居是在不同的子图中产生的,实际上这些embedding都是在可替代性的结构中定义的embedding。

再来看看关键的A_{c} A_{s} 这部分是通过attention结构得到的分数:

后面的计算就简单了:

最后我们还需要进行一次pooling操作:

这里我们用另一个前面提到的符号来定义这个阶段学习到的embedding,z˜(𝑠)。

3.4 Semantic Integration: Knowledge Transfer between Decoupled Node Representations

第二阶段的主要工作是把第一阶段学习到的embedding信息进行语义聚合。

Direct transfer of item semantics.

其中,函数f是为了将不同的embedding映射到同一个空间中。

Back transfer.


3.5 Model Optimization & Prediction

模型最终要学习的目标跟GraphSage中的方式一样,为了让相邻的节点更相近,让更远的节点也变得更远:

最终,预测的时候,我们只需要计算:

这两个概率就够了。

四、实验结果



最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 203,772评论 6 477
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,458评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,610评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,640评论 1 276
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,657评论 5 365
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,590评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,962评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,631评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,870评论 1 297
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,611评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,704评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,386评论 4 319
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,969评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,944评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,179评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 44,742评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,440评论 2 342

推荐阅读更多精彩内容