图神经网络自监督学习工具箱 - PT-HGNN(三)

文章名称

【KDD-2021】【Beijing University of Posts and Telecommunications/Singapore Management University】Pre-training on Large-Scale Heterogeneous Graph

核心要点

文章旨在解决现有图预训练任务只针对同构图的问题,提出了大规模异构图预训练框架PT-HGNN,利用节点级别和子图级别的预训练任务进行对比学习,并将学习到的语义知识和结构特性迁移到下游任务。为了适应大规模数据,作者还提出了基于异构图的Personal PageRank,来增加训练速度。

上节介绍了子图级别的预训练任务,本节继续介绍加速大规模图训练的方法。

研究背景

如前所述,在进行异构图学习是挑战包括,

  • 如何在设计方法学习异构图中各类型节点的特征和语义差异,例如节点的出入度差异等。并利用对比是学习将这种特性encode到图节点的向量表示中。
  • 如何设计方法快速的学习大规模图数据中的上述特性。

方法细节

方法架构

PT-HGNN的整体框架如下图所示,大致可以分为3个主要的阶段,采用2种预训练任务进行pre-train,


framework of PT-HGNN

针对大图数据的稀疏化

在图数据节点和边的数量比较庞大时。很难将全部数据都拿来进行训练。同时,也会造成更多的噪声和资源浪费。因此,很多方法考虑采用在线或离线的采样方式来缓解这一问题。在线方法一般难以满足(时间)性能需求,更多的方法采用离线采样的方式。Personal PageRank可以帮助寻找图中对目标节点影响比较重要的邻域[1],然而,PPR只针对于同构图,作者将其扩展到Heterogeneous的场景。

PPR利用节点的出入度和邻接矩阵计算转移概率,以此反映该节点的重要程度。然而,在异构图中,由于类别不同,一些节点天然的具有较高的度,导致不能和其他不同类别的节点相比。如果所有节点放在一起计算转移矩阵,则会导致转移概率存在偏倚的情况。因此,作者利用如下图所示的方法,在固定的关系R上计算转移概率矩阵{\Pi}^{R}_{}。其中,S是一个平滑矩阵(有点类似卷积),{D}^{}_{{A}^{}_{i}}是对角阵,对角元素是所有类别是{A}^{}_{i}的元素的度。{A}^{R}_{}是关系R下的邻接矩阵(注意,这个邻接矩阵中只有类型为A_1, A_2的节点)。{R}^{-1}_{}表示R逆关系(也就是说关系是有方向的,作者写了文章,和,文章是作者写的,互为逆关系)。

relational PPR
S matrix

显然,上述矩阵乘法计算量非常大。因此作者采用random walk的方法来近似这个计算。具体做法参见代码实现部分。

得到状态转移矩阵{\Pi}^{R}_{},相当于得到了节点间的影响程度,通过从邻接矩阵中选取top-k的连边可以实现对大规模图数据的系数化。具体的公式如下图所示。 可以看到,筛选是利用{\Pi}^{R}_{}做的,而筛选的目标是邻接矩阵中的元素(也就是边)

Edge Sparsification

最终,PT-HGNN采用如下图所的目标函数训练模型。

Total Loss

代码实现

基于random walk的PPR方法的伪代码如下图所示。其实,可以理解为通过迭代的方法,不断地减少转移概率的残差。

Relation-Based PPR with Random Walk

文章引用

[1] AleksandarBojchevski,JohannesKlicpera,BryanPerozzi,AmolKapoor,Martin Blais, Benedek Rózemberczki, Michal Lukasik, and Stephan Günnemann. 2020. Scaling graph neural networks with approximate pagerank. In KDD. 2464–2473.

[7] Yuan Fang, Wenqing Lin, Vincent Wenchen Zheng, Min Wu, Kevin Chen-Chuan Chang, and Xiaoli Li. 2016. Semantic proximity search on graphs with metagraph- based learning. In ICDE. 277–288.

[10] Kaiming He, Haoqi Fan, Yuxin Wu, Saining Xie, and Ross Girshick. 2020. Mo- mentum contrast for unsupervised visual representation learning. In CVPR. 9729– 9738.

[27] Yizhou Sun, Jiawei Han, Xifeng Yan, Philip S. Yu, and Tianyi Wu. 2011. Path- Sim: Meta Path-Based Top-K Similarity Search in Heterogeneous Information Networks. In VLDB. 992–1003.

[28] Aäron van den Oord, Yazhe Li, and Oriol Vinyals. 2018. Representation Learning with Contrastive Predictive Coding. arXiv preprint arXiv:1807.03748 (2018).

[*1] Pedersen, Lilian, Francisco Rodríguez and Fernando for Secretaria de Transporte Brunstein. “Manual de manejo ambiental y social.” (2007).

©著作权归作者所有,转载或内容合作请联系作者
禁止转载,如需转载请通过简信或评论联系作者。
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 224,509评论 6 522
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 96,093评论 3 402
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 171,632评论 0 366
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 60,848评论 1 300
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 69,855评论 6 399
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 53,353评论 1 314
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 41,738评论 3 428
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 40,706评论 0 279
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 47,240评论 1 324
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 39,268评论 3 345
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 41,398评论 1 354
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 37,012评论 5 350
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 42,709评论 3 337
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 33,178评论 0 25
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 34,312评论 1 275
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 49,932评论 3 381
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 46,464评论 2 365

推荐阅读更多精彩内容