为什么研究GCN
CNN无法处理Non Euclidean Structure的数据,学术上的表达是传统的离散卷积在Non Euclidean Structure的数据上无法保持平移不变性。也就是说在拓扑图中每个顶点的相邻顶点数目都可能不同,那么也就无法用一个同样的尺寸的卷积核来进行卷积运算。CNN无法处理Non Euclidean Structure的数据,又希望在拓扑图上有效的提取空间特征来进行学习,所以GCN成为研究重点。
- 欧几里得结构(Euclidean Structure)
- 非欧几里得结构(Non Euclidean Structure)
两种主流方式来提取拓扑图的空间特征
- 基于空间域spatial domain(顶点域vertex domain)的代表文章 :Learning Convolutional Neural Networks for Graphs ——ICML 2016
- 基于频谱域spectral domain的代表文章 :借助图谱的理论来实现拓扑图上的卷积操作 Spectral Networks and Deep Locally Connected Networks on Graphs ——NIPS 2014
本篇论文主要方法是基于频谱域的方法
准备知识
度矩阵(D)
节点的度表示与该节点相连的边的数量。图的度矩阵即用于描述图中每个节点的度的矩阵,一般使用
表示。其中,
表示节点
的度。度矩阵是一个对角矩阵,对于无向图来说,一般只使用入度矩阵或出度矩阵。
邻接矩阵(A)
图的邻接矩阵指用于表示图中节点的连接情况的矩阵。该矩阵可以是二值的,也可以是带权的。对于有个节点的无向图来说,邻接矩阵是一个
的实对称矩阵。
拉普拉斯矩阵(L)
定义矩阵,其元素为:
其中,表示节点
的度,则该矩阵称之为图
的拉普拉斯矩阵(
)。其具有以下特点:
- 拉普拉斯矩阵是半正定矩阵。
- 特征值中0出现的次数就是图连通区域的个数。
- 最小特征值是0,因为拉普拉斯矩阵每一行的和均为0。
- 最小非零特征值是图的代数连通度。
相应的归一化拉普拉斯矩阵为:
所以,图的拉普拉斯矩阵可以通过如下方法求得:
图的拉普拉斯矩阵也可以称为导纳矩阵(admittance matrix)或基尔霍夫矩阵(Kirchohoff matrix)。
-
graph举例:
未完,待续。。。