【论文笔记】Graph Transformer Networks

原文摘自我自己的博客Link:http://holdenhu.cn/2020/paper-notegraph-transformer-networks/

题目:《Graph Transformer Network》

作者:Seongjun Yun

来源:NeurIPS2019

源码:Not published yet

笔记:Hu Hengchang

Intro


GTNs(Graph Transformer Networks)的主要功能是在原始图上识别未连接节点之间的有用连接。

Transformer来学习有用的多跳连接,即所谓的元路径。将异质输入图转换为每个任务有用的元路径图,并以端到端方式学习图上的节点表示。

Definition


heterogeneous

异质图:例如,引用网络具有多种类型的节点(例作者、论文、会议)和由它们之间的关系(如作者-论文、论文-会议)定义的边。

homogeneous

同质图,具有一种类型的节点和边的标准图。

Related Work


传统的GNN

是一种两阶段的方法,但每个问题都需要手工构建元路径。这些元路径的选择对下游分析的准确性有很大的影响。

包括spectral和non-spectral两种方法。

  • spectral是基于spectral domain(using Fourier basis)上进行卷积。

  • non-spectral直接在图上沿着edge执行卷积操作。

Contribution


大多数现有的GNNs都被设计为在固定(fix)和同质(homogeneous)的图上学习节点表示。当在不确定的图或由各种类型的节点和边组成的异质(heterogeneous)图上学习表示时,这些限制尤其成问题。一般的GNN手动定义元路径,但GTNs可以学习有效的元路径。

因此GTNs的出现:

  1. 提出了一种新的图变换网络,识别有用的元路径和多跳连接来学习图上的有效节点表示。

  2. 图的生成是可解释的,提供有效路径连接的解释。

  3. 证明了图变换网络学习的节点表示的有效性,从而获得了最佳的性能,而现有的方法在异质图的所有三种基准节点分类中都使用了领域知识。

Implemention


我们的GTNs的目标是生成新的图结构,同时学习到有效的node representation。GTNs使用多个candidate adjacency matrices寻找新的图结构。

preliminaries

  • 图表示为G=(V,E), V is set of nodes, E is set of observed edges。

  • \mathcal{T}^v\mathcal{T}^e分别表示node的种类,和edge的种类的set。

  • 异质图能表示为adjacency matrices的集合 {A_k}_{k=1}^K, 其中K=|\mathcal{T}^e|, 它也可以写成Tensor \mathbb{A} \in \mathbf{R}^{N \times N \times K}

Meta-path Generation

meta-path
  1. 此图即表示GT(Graph Transformer) Layer,它先从tensor \mathbb{A}(每一片就是一种edge type)中用权重选择adjacency matrices(即edge type)。权重选择的方式也可以理解成卷积,卷积后的两个matrices分别是两个图解构,表示为Q_1Q_2

  2. 选择matrices的两个卷积核是用softmax计算得出的(比如图中例子,一个卷积核说取最前面的matrices,一个卷积核说取最后面那个matrices),但实际上是带有权重分配的。

  3. 然后再将两个matrices组成新的图结构(即两个邻接矩阵的矩阵乘法,{Q_1}{Q_2})。

用数学形式可以表示为:

  • 选择的Q可以表示为:

Q=F\left(\mathbb{A} ; W_{\phi}\right)=\phi\left(\mathbb{A} ; \operatorname{softmax}\left(W_{\phi}\right)\right)

即得出的Q是将\mathbb{A}和权重参数W_{\phi}送去convolution layer卷积得到的

  • 每一个Q_i可以表示成:
    \sum_{t_{l} \in \mathcal{T}^{e}} \alpha_{t_{l}}^{(l)} A_{t_{l}}

其中\mathcal{T}^e是edge的类型集合,\alpha_{t_{l}}^{(l)}是edge第l种类型t_l在第l层的权重。

以图中为例:\mathcal{T}^e有4个{t_1,t_2,t_3,t_4}, 即对应4层matrices: {A_1,A_2,A_3,A_4},W_{\phi}={α_1,α_2,α_3,α_4}

  • 如果不是分两个Q,而是多个,则最后得到的结果新A可表示为:

A_P = \left(\sum_{t_{1} \in \mathcal{T}^{e}} \alpha_{t_{1}}^{(1)} A_{t_{1}}\right)\left(\sum_{t_{2} \in \mathcal{T}^{e}} \alpha_{t_{2}}^{(2)} A_{t_{2}}\right)...\left(\sum_{t_{l} \in \mathcal{T}^{e}} \alpha_{t_{l}}^{(l)} A_{t_{l}}\right)

Multi-channel

为了同时生成多种类型的元路径,图1中1×1卷积的输出通道设置为C。

multi-meta-path

然后,GT层产生一组meta-path,中间邻接矩阵Q1和Q2成为邻接张量\mathbb{Q}_1\mathbb{Q}_2 \in \mathbf{R}^{N \times N \times C},如图2所示。通过多个不同的图结构学习不同的节点表示是有益的。在l个GT层堆栈之后,将GCN应用于元路径张量\mathbb{A}^{l} \in \mathbf{R}^{N \times N \times C}的每个通道,并将多个节点的representation拼接起来。

结果Z的生成可表示为:

Z=\|\|_{i=1}^{C} \sigma\left(\tilde{D}_{i}^{-1} \tilde{A}_{i}^{(l)} X W\right)

其中||是concatenation操作。C表示channel数量。 \tilde{A_{i}^{l}}=A_{i}^{l}+I, 表示张量\mathbb{A}^{(l)}的第l个通道。\tilde{D_i}\tilde{\mathbb{A}_i}的degree matrix,W \in \mathbf{R}^{d \times d} 是训练权重矩阵,X \in \mathbf{R}^{N \times d}表示特征矩阵。

Evaluation


研究问题:

  • Q1:GTN生成的新图结构对学习node representation是否有效?

  • Q2:GTN能否根据数据集自适应地产生可变长度的元路径?

  • Q3:如何从GTNs生成的邻接矩阵来解释每个元路径的重要性?

Dataset

dataset

GTN和其他节点分类基线的性能

baseline

可以看到GTNs获得最高性能。

可解释元路径

explain

Note: 这里的不同字母表示不同种类的node.

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 219,366评论 6 508
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 93,521评论 3 395
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 165,689评论 0 356
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,925评论 1 295
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,942评论 6 392
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,727评论 1 305
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,447评论 3 420
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,349评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,820评论 1 317
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,990评论 3 337
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 40,127评论 1 351
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,812评论 5 346
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,471评论 3 331
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 32,017评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,142评论 1 272
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,388评论 3 373
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 45,066评论 2 355

推荐阅读更多精彩内容