[论文精读]Correct and Smooth: 用一个MLP超越GNN

Overview

从label propagation得到启发，作者提出了一种建模思路，先训练好一个MLP，再对MLP的结果进行平滑，node classification的结果可以超越GNN。思路大概是这样：
1.用节点特征x和节点标签y训练一个MLP
2.取得MLP的预测结果z=MLP(x)，对残差e=y-z进行平滑，z=z+e
3.对z进行平滑

Detail

MLP阶段：首先是第一步的MLP，这是一个四层神经网络，结构如下所示：

class MLPLayer(nn.Module):
    def __init__(self, input_dim, output_dim, dropout):
        super(MLPLayer, self).__init__()
        self.linear = nn.Linear(input_dim, output_dim)
        self.bn = nn.BatchNorm1d(output_dim)
        self.dropout = dropout
    
    def forward(self, x):
        x = self.linear(x)
        x = self.bn(x)
        x = F.relu(x, inplace=True)
        x = F.dropout(x, p=self.dropout, training=self.training)
        return x
    
    
class MLP(nn.Module):
    def __init__(self, n_features, hidden_dim, n_labels, dropout):
        super(MLP, self).__init__()
        self.layer1 = MLPLayer(n_features, hidden_dim)
        self.layer2 = MLPLayer(hidden_dim, hidden_dim)
        self.layer3 = nn.Linear(hidden_dim, n_labels)
        
    def forward(self, x):
        x = self.layer1(x)
        x = self.layer2(x)
        x = self.layer3(x)
        return F.softmax(x, dim=1)

x是node feature，y是node label。z=MLP(x)作为y的预测。对这个MLP完整地训练一遍。

Correct阶段：训练好MLP之后，第二步对残差进行平滑。 $E\in \mathbb{R}^{n\times c}$ 是残差矩阵，第 $i$ 行第 $j$ 列代表了节点 $i$ 的标签 $j$ 的残差。 $L$ 代表training set， $U$ 代表validation和test set，那么 $E$ 的定义是： $E_L=Y_L-Z_L, E_U=0$
令初始的 $E^{(0)}=E$ ， $S=D^{-1/2}AD^{-1/2}$ ，作者给出的原始的correct方法是： $E^{(t+1)}=(1-\alpha)E^{(0)}+\alpha SE^{(t)}$ $E$ 一般迭代十来次就收敛了： $Z^{(r)}=Z+E^{(\infty )}$
由于 $E$ 的variance发生了变化，所以需要进行scale。原文讲了两种scale方法，第一种方法叫做Auto-scale（ $e_j表示E的第j行$ ）： $\sigma \leftarrow\frac{1}{\left | L \right |}\sum_{j\in L}\left \| e_j \right \|_{1}$ $E^{(t+1)}\leftarrow(1-\alpha)E^{(0)}+\alpha SE^{(t)}$ $e_j^{\infty }\leftarrow \frac{\sigma}{\left \| e_j^{\infty } \right \|_{1}}e_j^{\infty }$
第二种方法叫Fdiff-scale： $E^{(t+1)}\leftarrow D^{-1}AE^{(t)}$ $E_L^{(t+1)}\leftarrow E_L^{(0)}$ $Z^{(r)}\leftarrow Z+sE^{(\infty )}$ 其中s是自行设定的参数。用numpy实现的代码如下：

def _correct_autoscale(y, z, train_mask, propagation_matrix, alpha, n_iters=50):
    e = np.where(train_mask, y - z, np.zeros(shape=z.shape))
    e_l1 = np.linalg.norm(e, ord=1, axis=1)
    num_train = train_mask[:, 0].sum()
    sigma = e_l1.sum() / num_train
    e_init = e.copy()
    for _ in range(n_iters):
        e = (1.0 - alpha) * e_init + alpha * (propagation_matrix @ e)
    scale = sigma / np.abs(e).sum(axis=1, keepdims=True)
    scale[np.isinf(scale) | (scale > 1000)] = 1.0
    return z + scale * e


def _correct_fdiff_scale(y, z, train_mask, propagation_matrix, scale, n_iters=50):
    e = np.where(train_mask, y - z, np.zeros(shape=z.shape))
    e_init = e.copy()
    for _ in range(n_iters):
        e = propagation_matrix @ e
        e = np.where(train_mask, e_init, e)
    return z + scale * e

Smooth阶段：设 $H\in \mathbb{R}^{n\times c}$ ， $H_L=Y_L$ ， $H_U=Z_U^{(r)}$ ，初始值 $H^{(0)}=H$ ，对 $H$ 进行平滑： $H^{(t+1)}=(1-\alpha)H^{(0)}+\alpha SH^{(t)}$ 用numpy实现的代码如下：

def _smooth(y, z, train_mask, propagation_matrix, alpha, n_iters=50):
    h = np.where(train_mask, y, z)
    h_init = h.copy()
    for _ in range(n_iters):
        h = (1.0 - alpha) * h_init + alpha * (propagation_matrix @ h)
    return h

最终hard prediction为： $y_{pred}=argmax\left ( H^{(\infty )},dim=1 \right )$

Comment

我自己写代码复现了一下，基本没怎么参考官方的代码，在Cora、Citeseer和pubmed都得到了和paper里差不多的分数。有趣的是，我去掉了correct步骤之后，分数反而提升了！一个MLP+smooth，就基本和APPNP没啥区别了。区别在于，APPNP的梯度回传阶段（训练阶段）是MLP+smooth，此文的梯度回传阶段（训练阶段）仅仅是MLP。因此我又用更少的label rate（20 labeled nodes per class），进行了半监督实验。经过调参发现，MLP+smooth基本能实现APPNP差不多的分数。但是如果去掉了correct可能文章就发表不出来了，因为模型太简单。

Reference

论文Arxiv地址
 Re1: 读论文 C&S (Correct and Smooth) - CSDN
论文官方代码
 PyG Correct and Smooth类

最后编辑于：2021.10.21 15:07:58

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 212,542评论 6赞 493
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 90,596评论 3赞 385
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 158,021评论 0赞 348
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 56,682评论 1赞 284
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 65,792评论 6赞 386
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 49,985评论 1赞 291
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 39,107评论 3赞 410
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 37,845评论 0赞 268
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 44,299评论 1赞 303
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 36,612评论 2赞 327
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 38,747评论 1赞 341
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 34,441评论 4赞 333
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 40,072评论 3赞 317
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 30,828评论 0赞 21
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 32,069评论 1赞 267
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 46,545评论 2赞 362
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 43,658评论 2赞 350

[论文精读]Correct and Smooth: 用一个MLP超越GNN

Overview

Detail

Comment

Reference

推荐阅读更多精彩内容