CS224W-图神经网络 笔记3.1:Motifs and Structural Roles in Networks - 网络的结构(Motifs and Graphlet)

本文总结之日CS224W Winter 2021只更新到了第四节,所以下文会参考2021年课程的PPT并结合2019年秋季课程进行总结以求内容完整
课程主页:CS224W: Machine Learning with Graphs
视频链接:【斯坦福】CS224W:图机器学习( 中英字幕 | 2019秋)

1 引言

前面两节,讨论的网络的整体统计信息,这一节开始聚焦网络中的一些特殊结构(子图)和其中节点的的角色。

2 一些新概念

在深入学习本节前,需要先理解几个关键概念。

  • 子图/子网络(Subgraph/Subnetwork)
  • motifs
  • graphlet
  • (节点的)结构性角色(structural rols)

2.1 子图Subgraph/子网络/Subnetwork

定义:字面上就可以理解,就是网络中的一部分节点和它们之间的边。

重要性(why):我们可以借助子图挖掘出图的一部分性质和信息。

图片

例如,对不同类型的网络统计三个节点的各类子图出现的频次,得到不同网络的重要性概览(Network significance profile)。同类网络,有相似的子图分布。有的子图低于平均,有的高于平均。顺带一提高于平均的是下面要介绍的motifs。

图片

2.2 motifs

定义:(what)一类特殊子图的统称,它具有如下特点:

  • pattern:小的诱导子图(Small induced subgraph)。

    • 诱导induced 表示节点之间的连接都包含在内。
  • recurring:高频出现

  • significant:重要指比预想(随机图)中出现的频率更高。

其他特点:

  • 同一类motifs 之间,诱导子图的边必须完全一致。多一条边改个方向都不行
  • 不同 motifs 之间可以重叠。

重要性(why)

  • 帮助我们理解网络,理解不同节点之间关系。描述了节点间交互模式,通过模式匹配去理解网络。

如何衡量重要性(how)

因为Motifs 的定义要求Motif出现频率要更高,更重要。因此可以通过与随机网络中的Motifs数进行对比,以衡量真实网络中一种子图的显著性。具体通过下面的公式进行:

图片

因为,通常更大规模的网络有更高的Z值。因此,为了更方便在不同规模的网络之间进行比较,通过标准化之后的Z值的向量SP的方式解决。如上图所示。

关键问题 —— 随机网络怎么生成?

  • 配置模型:根据给定的度序列k_1, k_2, …, k_N生成随机图,用来与真实网络进行对比。通常称为零模型(null model)

  • 生成配置模型的两种方式:

图片
    • 随机连接: 该方法生成的随机图,因为会忽略重边和自连接,故同一节点的度会发生改变。但根据《网络科学引论》的p275 。当网络规模足够大时,网络中的自边和重边的平均数将会趋于常数
    • 随机交换: 随机选择一对边,然后重连两个边,交叉两个点。生的随机图的节点的度,不发生改变。但计算的代价会较高,运行慢。为了保证随机图的随机性,需要运行的次数为 Q * E 次,其中Q应尽可能的大,如100。

获取具有相同节点数,边数,节点度数的随机图之后,我们就可以计算子图iZ值。高值说明该子图是图G的一个Motif。

将一组子图的Z值作为网络的特征向量SP,我们就得到了上面展示的对比图1。

2.3 Graphlets

  • 非同构子图单元,是一类特殊的子图。Graphlets是对motif的扩展。它与motifs的区别:

    • motif是从全局的角度来描述的。用不同motifs来构成一个图的向量表示。

    • 而Graphlet是从局部(节点)的角度出发来描述节点。用不同graphlet中的节点相对位置(局部信息),来形成一个节点的向量表示。

截屏2021-02-01 下午3.27.39
截屏2021-02-01 下午3.27.17
截屏2021-02-01 下午3.36.52

2.3.1 同构图 (isomorphic graph)

可以参考知乎上的解释: 怎么理解图的同构?怎么判断两个图是否同构? - 少文的回答 - 知乎

这里给出图论上的定义:

在图论中,假设G=(V,E)和G1=(V1,E1)是两个图,如果存在一个双射m:V→V1,使得对所有的x, y \in V均有x, y \in E等价于m(x)m(y) \in E_1,则称G和G1是同构的。

简单的说,两个同构图,节点和边一致,且存在一个一一映射使得每个节点相互对应。

2.3.2 非同构子图集

不同节点数的子图可以构成的非同构子图数量不同,节点越多,非同构子图数量呈指数增加。如下图, 可以看到,不同颜色的点,代表相对位置不同类型的点。

图片

2.3.3 Graphlet degree vector(GDV)

通过计算一个节点所在的Graphlets中不同的非对称位置,可以对节点附近的局部结构进行衡量。

GDV的定义:一个节点所在位置的频率组成的向量。

2.4 如何获得motifs和graphles(how)

可将问题拆解为两步:

  • 1.枚举所有大小为k的子图。

  • 2.计算这些子图出现的次数。

    • 这里涉及子图同构的判断,是一个 NP-complete问题,计算困难。通常,子图的大小选择在 3到8个点。

第一步:Extract Subgraph Enumeration(ESU)

为了枚举所有大小为k的子图,老师介绍了ESU算法。ESU算法[Wernicke 2006]中的两个集合:

  • V_{subgrapg} : 目前已经构造的子图
  • V_{extension} : 用于扩展子图的候选节点集合

算法思想:每个节点分配唯一序号,从一个节点 开始,添加符合以下性质的节点 到:

  • u的节点编号必须大于v
  • u只能是某个新加入的节点w的邻居,不能是任何V_{subgrapg}中的节点的邻居

ESU算法是一个递归算法,运行过程呈现为一个深度为 k 的树,被称作ESU-tree

图片

第二步:Extract Subgraph Enumeration(ESU)

为了计算这些子图出现的次数,因为涉及到如何判断图与图之间是否同构,可使用 McKay’s nauty 算法 [McKay 1981]。

即若图G中任意一对邻接的节点 u 和 v ,在图H中都有f(u)和f(v)邻接,则图G和图H同构。

n个节点的两个同构图判断,需要n!次计算,计算量很大。

图片

通过上面两步我们可以得到图的 motifs 和 graphlet和对应GDV。

截屏2021-02-01 下午3.47.00

3 总结

本节,为了研究网络的结构特性,通过定义了motif 和 graphlet 两类子图,从不同角度对图的拓扑性质进行了研究。

其中,GDV 算是早期node embedding的一种。

截屏2021-02-01 下午3.30.20

4 参考文章

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 203,772评论 6 477
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,458评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,610评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,640评论 1 276
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,657评论 5 365
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,590评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,962评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,631评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,870评论 1 297
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,611评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,704评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,386评论 4 319
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,969评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,944评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,179评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 44,742评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,440评论 2 342

推荐阅读更多精彩内容