论文笔记 | 使用GCN建模关系数据

本文主要复述论文["Modeling Relational Data with Graph Convolutional Networks"] 的主要内容,以便自我回顾,也希望可以给大噶带来帮助~
感谢小姐妹带我读论文~

摘要

本论文介绍的是关系图卷积网络模型(R-GCN),并在两个已知的知识库上实现关系预测与实体分类。R-GCN是在GCN的基础上优化得到的神经网络模型,原来的GCN处理的是具有拓扑结构的数据集之间的单关系,R-GCN则可以处理知识库中的多关系数据特征。与仅解码器的基准对比,改模型在FB15K-237上有29.8%的改进。

问题介绍

目前知识库的信息不完整,预测知识库中丢失的信息是SRL的主要任务。依据先前工作,考虑知识库的存储模式是三元组式的集合(主语,谓语,宾语),例如(Mikhail Baryshnikov, educated at, Vaganova Academy)。并假定实体为类型标签,例如(Vaganova Academy is marked as a university)。则知识库的表示完成带标签的有向图,具有带标签编码的节点和三元组实体。具体结构见Figure1。
Figure 1

论文中考虑两个基本的SRL任务:关系预测(丢失三元组的恢复)和实体分类(为实体分配类型或分类属性)。 在这两种情况下,通过图结构编译器可以获得丢失的信息。比如,知道Mikhail Baryshnikov是在Vaganova学院接受教育的,这意味着Mikhail Baryshnikov应该有标签person,其三元组 (Mikhail Baryshnikov, lived in, Russia)属于知识图。

GCN

图卷积神经网络应用在具有拓扑结构的图数据集上,其与CNN的计算方式类似,滤波器参数在图中的所有位置或者说所有局部位置都可共享,目标是学习图G=(V, E)上的特征映射。
定义卷积网络中的第l+1层,其向前传播的非线性激活方程可表示为
H^{(l+1)}=f(H^{(l)}, A)=\sigma(A·H^{(l)}·W^{(l)})其中H(0)=X,H(L)=ZX∈(N×D)是节点特征向量的输入矩阵,N为节点数,D为特征维数。Z∈(N×F)为输出矩阵,A为图结构的邻接矩阵,描述每个节点的度数。\sigma是非线性激活函数,比如ReLuW是当前层的权重矩阵。
上式的传播规则有两个限制:一是节点本身的信息量未被计入,二是A本身未被正则化,直接进行矩阵运算会改变特征向量的域。Kipf & Welling (ICLR 2017)提出了矩阵的对称归一化,对第一个问题引入节点自环,即此时的A=A+I;对第二个问题引入节点度的对角化矩阵,由D^{-1}A可以实现节点特征的归一化。实际上,借鉴对拉普拉斯矩阵的标准化公式D^{-1/2}LD^{-1/2}可以更好的描述邻接矩阵的动态特性,其中L=D-A

此处引入拉普拉斯矩阵进行归一化的行为我不是很理解,关于谱论的知识我也没有补,想要深入探讨的旁友可以参阅其他资料,此处发一个GCN传播规则的解释的链接,大嘎可以参考参考----GCN的空间域理解

那么带入之后我们就可以得到下列的前向传播公式:f(H^{(l)},A)=\sigma(D'^{-1/2}A'D'^{-1/2}H^{(l)}W^{(l)})其中A'=A+ID'A'的节点度矩阵。
再应用Weisfeiler-Lehman算法到这个GCN模型上,可以得到下式中以向量形式表示的传播规则。Cij是边<vi,vj>的归一化常数,也就是经该算法得到的对邻接矩阵进行对称归一化的变体。hvj则是对当前节点i得到的邻居节点j的特征向量,并经过hash(·)进行特征更新。

R-GCN

GCNs可以有效获取局部图特征,在图分类、基于图的半监督学习模型中得到改进。作者对于R-GCNs定义了下述的传播准则:

对于节点或实体,表示关系r∈R下的节点i的邻居节点集,是归一化常数,可以预先学习或选择(例如)。

正则化

多关系模型中的参数数量和关系数量增长很快,在计算过程中很容易导致稀疏关系矩阵的过度拟合。论文中引入了两种正则化权重矩阵的方式:基函数分解和块对角分解。
奇函数分解可以看做是不同关系类型之间有效权重共享的一种形式,对于每个W^{(l)}r定义形式为(3)式,其V^{(l)}b∈R^{(d^{(l+1)}×d^{(l)})}作为基础变换,仅系数a^{(l)}r,b依赖于r

块对角分解视为每种关系类型对权重矩阵的稀疏约束,通过块分解可以将潜在特征分组为变量集,这些变量集在组内比在组间更加紧密的耦合。这两种分解都可以帮助我们减少训练当中的参数规模。

模型结构

与常规GCN不同,该模型引入了由边的类型与方向决定的关系转换,等式中+的后一项表示节点的自连接。模型中每个节点参数的更新过程可以Figure2来描述,红色部分为节点或者说实体,与蓝色的邻接节点进行矩阵运算,再对每种关系的边类型进行转换,得到绿色部分的已做归一化处理的结果总和,累加后经过激活函数传递,由此在模型中并行更新节点参数。
Figure2

整个模型采用堆叠层,即上一级的输出作为下一级的输入。作者在初始化时仅考虑了无特征向量方法,选择图节点的独热编码作为第一层的节点向量输入,对于块表示,通过线性变换将one-hot编码映射为密集表示。

  • Entity classification:
    在模型堆叠的最后一层,对每个节点使用softmax分类器,财通R-GCN提供的节点表示来预测标签,将所有标记节点上的交叉熵最小化。实体分类的模型示意图可参考Figure a3。


    Figure 3
  • Link prediction:
    三元组(subject, relation, object)关系的预测要求有实际可依赖的关系库。链接预测的模型示意图参考Figure 3b。一般知识库由有向标记图G=(V, E, R)表示,作者在这里提供了一个子集E,链接预测任务则是将f(s, r, o)匹配给概率最高的边(s, r, o)。作者引入了图自动编码器模型:1).编码器是生成实体的潜在特征表示形式,即将每个实体映射到实向量;2).解码器是对特征表示进行张量分解来重建链接标签。实验中使用DistMult因子分解作为分数函数,将每种关系用对角矩阵Rr∈R^{{d×d}}表示,分数函数则表示为f(s, r, o)=es^T·Rr·eo,同样使用交叉熵优化链接预测任务结果。

实验评估

实体分类

数据集选择了RDF格式的四个数据集,详细见table1。

结果见table2。
链接预测

数据集的选择见table3。

实验结果见table4。
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
禁止转载,如需转载请通过简信或评论联系作者。
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 205,132评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 87,802评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 151,566评论 0 338
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,858评论 1 277
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,867评论 5 368
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,695评论 1 282
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,064评论 3 399
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,705评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 42,915评论 1 300
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,677评论 2 323
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,796评论 1 333
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,432评论 4 322
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,041评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,992评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,223评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,185评论 2 352
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,535评论 2 343

推荐阅读更多精彩内容