图神经网络自监督学习工具箱 - CPT-HG(一)

文章名称

【CIKM-2021】【Beijing University of Posts and Telecommunications/WeChat Search Application Department, Tencent Inc.】Contrastive Pre-Training of GNNs on Heterogeneous Graphs

核心要点

文章旨在解决现有预训练图神经网络方法仅仅适用于同质图,忽略了异质图的特点,并不能解决异质图网络对标签数据的以来。因此,作者提出CPT-HG方法,利用关系级别和子图级别的预训练任务,从大量异质图中学习通用的结构和语义信息。

方法细节

问题引入

GNN是处理图数据的有力工具,现实世界中大部分的数据可以被抽象为图数据,因此GNN的应用越来越广泛。GNN通过不断归纳邻居节点的属性和结构信息来学习图数据的特征。然而,GNN需要大量的标签数据,但是标签数据的获取费时费力。

现有方法利用图自监督学习,在无标签数据上进行预训练,学习可迁移的图知识。作者将图自监督方法大致分为2类,

  • 在一部分图上进行预训练,在另一部分图上进行fine-tuning,每一个图是一个样本[13, 28]。
  • 在图的一部分节点上预训练,在另一部分节点上fine-tuning,每个节点是一个样本[14]。

然而,不论是上述哪一种,都只适用于同构图。将图预训练方法应用于异构图上时存在2个挑战,

  • 异构图中的节点和边具有不同的类型,如何学习异构嵌入表示,encode异构信息是一大挑战。
  • 异构图中存在更丰富的语义信息,不同类型的组合导致了比同构图更丰富的多样性,数据也更稀疏,也更难保留高阶语义信息(或者说范围更广,而不仅仅是节点和边的语义信息)。

方法细节

为解决上述问题,作者提出了CPT-HG方法,尝试将预训练方法应用于异构图。如上所述,作者在节级别和子图级别分别构建用于对比学习的正负样本,并分别学习节点和高阶语义信息,其整体结构如下图所示。

overview of CPT-HG
  • relation-level pre-train task。该层级的pre-train方法主要以一种固定的关系为轴(锚点),调整节点构造负样本。例如,<p_1, P-A, a_1>表示一个文章-作者三元组,其关系RP-A作者将该关系类型下相连的节点视作正样本对,而用如下两种方法构造负样本。
    • inconsistent relations。给定一个三元组<u, R, v>则其inconsistent relation负样本是指关系不同的三元组(当然其中一个节点要是u或者v)。例如,<u, R^-, w>中的w就是一个负样本与u组成负样本对u, w{R}^{-}_{}表示边不是R类型。具体可以形式化为如下图所示。

      relation-level negative samples

      获得负样本对后,利用如下图所示的对比损失进行训练,值得注意的是,由于不同的边的关系类型不同,为了体现这种异质性,作者采用{W}^{}_{R}来投影头尾节点。

      inconsistent relations contrastive loss
    • unrelated nodes。现有方法在选择负样本时,一般选择图数据中不存在的连接关系作为负样本对,例如,与u不相连的节点{v}^{\phi}_{}。但是此类方法选择的负样本太过于简单了,很容易被区分。因此,作者采用k跳邻居的方式来构造负样本,例如,uk跳邻居{v}^{-}_{}其中,这k跳过程中的相连关系可以是任意,用*表示,即得到的负样本对为<u,*,{v}^{-}_{}>,可以形式化为如下图所示,此处作者采用k=5

      unrelated nodes

      获得上述负样本对后,利用如下图所示的对比损失进行训练,此处由于都是不是在不同类型的边之间对比,因此没有采用投影矩阵{W}^{}_{R}

      unrelated nodes contrastive loss

本节介绍了作者研究的问题背景和思路,以及如何在relation-level构造对比样本,下节继续介绍子图级别的对比学习。

心得体会

关系投影矩阵

在unrelated nodes的损失函数中要不要有{W}^{}_{R}感觉是需要实验的,从逻辑上讲,毕竟u,v是靠关系R紧密连接的,而其他k跳负样本是靠任意复合的关系*连接的。因此,也应该表明这种,

文章引用

[3] Ting Chen, Simon Kornblith, Mohammad Norouzi, and Geoffrey E. Hinton. 2020. A Simple Framework for Contrastive Learning of Visual Representations. In ICML.

[11] Kaiming He, Haoqi Fan, Yuxin Wu, Saining Xie, and Ross B. Girshick. 2020. Momentum Contrast for Unsupervised Visual Representation Learning. In CVPR. 9726–9735.

[13] Weihua Hu, Bowen Liu, Joseph Gomes, Marinka Zitnik, Percy Liang, Vijay S. Pande, and Jure Leskovec. 2020. Strategies for Pre-training Graph Neural Networks. In ICLR.

[14] Ziniu Hu, Yuxiao Dong, Kuansan Wang, Kai-Wei Chang, and Yizhou Sun. 2020. GPT-GNN: Generative Pre-Training of Graph Neural Networks. In SIGKDD. 1857–1867.

[16] Zhipeng Huang, Yudian Zheng, Reynold Cheng, Yizhou Sun, Nikos Mamoulis, and Xiang Li. 2016. Meta Structure: Computing Relevance in Large Heterogeneous Information Networks. In SIGKDD. 1595–1604

[28] Jiezhong Qiu, Qibin Chen, Yuxiao Dong, Jing Zhang, Hongxia Yang, Ming Ding, Kuansan Wang, and Jie Tang. 2020. GCC: Graph Contrastive Coding for Graph Neural Network Pre-Training. In SIGKDD. 1150–1160.

©著作权归作者所有,转载或内容合作请联系作者
禁止转载,如需转载请通过简信或评论联系作者。
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 212,884评论 6 492
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,755评论 3 385
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 158,369评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,799评论 1 285
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,910评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,096评论 1 291
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,159评论 3 411
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,917评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,360评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,673评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,814评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,509评论 4 334
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,156评论 3 317
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,882评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,123评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,641评论 2 362
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,728评论 2 351

推荐阅读更多精彩内容