【论文阅读】How powerful are graph neural networks

一般框架

aggregate:一个节点如何把它的邻居节点聚合起来
combine:聚合的特征 a 怎么和上一层的特征 h combine
不同的GNN都可以归纳到这两个框架下来。

Aggregation-based GNNs 的Agg函数与Comb函数的设计一般都是靠经验和启发式信息。

  1. 怎么样的设计才能达到最好的表征能力?
  2. GNNs框架表征能力上限是什么?

解决问题思路

  1. 表征能力的评价标准:图同构
    如果GNNs对图的嵌入能区分不同构的图,则有较强的表征能力。

图同构:具有相同节点数的G1和G2,若存在两图节点之间的一一映射,使得邻接矩阵不变,则同构。

  1. 图同构评价标准:WL test
    WL test是一种判断是否同构的有效算法。
  2. GNNs 能否具有和WL test一样的表征能力?有的话,怎么设计达到和WL一样的水平?

理论框架

先验知识

  1. Countable feature space
  2. GNNs的聚合框架可以看作是multiset函数。
    multiset:包含重复元素的集合。
  3. 聚合:



    如果有两层聚合,无论是GCN还是WL test,以蓝色节点为例,先由其二阶邻居信息聚合得到一阶邻居节点信息,再由一阶邻居信息聚合得到自己。
    WL test 是由单射函数(hash,不同输入得到不同输出)聚合
    GNN 是由max pooling 或者 mean pooling来聚合(不是单射函数)

重要结论

  1. GNNs框架的表征能力上界是WL test
  2. 如果GNNs的聚合函数是定义在multiset上的单射函数,那么GNNs和WL的表征能力一样强。



    无论是aggregation函数还是combine函数,还是readout函数,最好都是injective,能力才能最强。

  3. 具体设计



    c是当前节点信息,X是邻居节点信息,可以找到一个函数 f(x),同时运用于当前节点和邻居节点,则agg和com合起来表示为h(c,X).
    其中 φ和f函数都只说明了存在性,并没有给定具体形式,作者使用MLP拟合(具有泛化能力)。



    \epsilno理论上只能是无理数(在实验中可以是0), 这样能把节点和其邻居节点区分开。

分析其他GNN框架

  1. GCN是把邻居节点加和求平均,再经过一个MLP(乘W,送入Relu)
    A. 这说明单层感知机会把不同的局部结构map到相同的emb,从而导致不能区分图;
    B. 也说明单层感知机不具有万能拟合能力;
    C. 就算能map到不同的emb,也有可能导致线性分类器失效(XOR)。
  2. mean 和 max pooling区分不出来某些网络结构。
但是采用mean和max pooing的框架(GCN、GraphSage)表现都很好,那么它们学到什么?

mean pooling 学到的是分布。
mean只能区分不同distribution的局部结构。
所以在下述情况中,mean也可以表现得很好:
(1)当任务和节点feature的分布相关,而与具体的局部结构无关时;
(2)当节点具有丰富的feature,很少重复时。
这就解释了为什么GCN在做节点分类时,效果很好,因为每个节点的特征很难重复。
max pooling 学到的是 underlying set。
max处理muliset时,只关心其对应的underlying set。所以 max既没有学到局部结构,也没有学到distribution。
当我们关心 representative element 或者 “skeleton”时, max会有好效果。

GIN

  1. 为什么没有做节点分类?
    GIN框架关心的是如何表征图的拓扑结构信息,而节点分类结果与节点feature关系最大;
  2. 本文给出了GNNs的上界,所以基于aggregation的GNNs已经有天花板,但是不能考虑连边的方向的和权重;
  3. 其他的聚合框架没有分析,比如LSTM-based 和 Attention-based;
  4. 如果节点的feature space是连续的,则该文的分析框架失效;
  5. 不同的任务关注的网络信息不同,有的只关心节点特征,有的只关心网络拓扑结构,本文给出了如何选择不同聚合函数的范式。

WL-test 几乎不损失信息
GNNs存在压缩表示,会损失信息。

图网络读书分享会18期总结

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 215,133评论 6 497
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,682评论 3 390
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 160,784评论 0 350
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,508评论 1 288
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,603评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,607评论 1 293
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,604评论 3 415
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,359评论 0 270
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,805评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,121评论 2 330
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,280评论 1 344
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,959评论 5 339
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,588评论 3 322
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,206评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,442评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,193评论 2 367
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,144评论 2 352

推荐阅读更多精彩内容