《Semi-Supervised Classification with Graph Convolutional Networks》阅读笔记

为什么研究GCN

CNN无法处理Non Euclidean Structure的数据,学术上的表达是传统的离散卷积在Non Euclidean Structure的数据上无法保持平移不变性。也就是说在拓扑图中每个顶点的相邻顶点数目都可能不同,那么也就无法用一个同样的尺寸的卷积核来进行卷积运算。CNN无法处理Non Euclidean Structure的数据,又希望在拓扑图上有效的提取空间特征来进行学习,所以GCN成为研究重点。

  • 欧几里得结构(Euclidean Structure)
  • 非欧几里得结构(Non Euclidean Structure)

两种主流方式来提取拓扑图的空间特征

  • 基于空间域spatial domain(顶点域vertex domain)的代表文章 :Learning Convolutional Neural Networks for Graphs ——ICML 2016
  • 基于频谱域spectral domain的代表文章 :借助图谱的理论来实现拓扑图上的卷积操作 Spectral Networks and Deep Locally Connected Networks on Graphs ——NIPS 2014

本篇论文主要方法是基于频谱域的方法

准备知识

  • 度矩阵(D)
    节点的度表示与该节点相连的边的数量。图的度矩阵即用于描述图中每个节点的度的矩阵,一般使用
    D表示。其中,D_{i,i} \in 1\le i\le N表示节点i的度。度矩阵是一个对角矩阵,对于无向图来说,一般只使用入度矩阵或出度矩阵。

  • 邻接矩阵(A)
    图的邻接矩阵指用于表示图中节点的连接情况的矩阵。该矩阵可以是二值的,也可以是带权的。对于有N个节点的无向图来说,邻接矩阵是一个N \times N的实对称矩阵。

  • 拉普拉斯矩阵(L)
    定义矩阵L,其元素为:
    \begin{eqnarray} L(u,v)=\begin{cases} d_v & if\quad u = v \\ -1 & if(u,v)\in \epsilon\\ 0 & otherwise \end{cases} \end{eqnarray}

其中,d_v表示节点v的度,则该矩阵称之为图G的拉普拉斯矩阵(L = D - A)。其具有以下特点:

  • 拉普拉斯矩阵是半正定矩阵
  • 特征值中0出现的次数就是图连通区域的个数
  • 最小特征值是0,因为拉普拉斯矩阵每一行的和均为0
  • 最小非零特征值是图的代数连通度

相应的归一化拉普拉斯矩阵为:

\begin{eqnarray} L(u,v)=\begin{cases} 1 & if\quad u = v\quad and \quad d_v \neq 0 \\ \frac{-1}{\sqrt{d_u}\sqrt{d_v}} & if(u,v)\in \epsilon\\ 0 & otherwise \end{cases} \end{eqnarray}
所以,图的拉普拉斯矩阵可以通过如下方法求得:
L = D^{-\frac{1}{2}}LD^{-\frac{1}{2}} = I - D^{-\frac{1}{2}}AD^{-\frac{1}{2}}
图的拉普拉斯矩阵也可以称为导纳矩阵(admittance matrix)或基尔霍夫矩阵(Kirchohoff matrix)。

  • graph举例

未完,待续。。。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容