论文阅读“Deep Fusion Clustering Network”

Tu W, Zhou S, Liu X, et al. Deep Fusion Clustering Network[J]. arXiv preprint arXiv:2012.09600, 2020.

摘要翻译:

深度聚类是数据分析的基本而又具有挑战性的任务。近年来,将自编码器与图神经网络相结合,利用结构信息提高聚类性能的趋势越来越明显。然而,我们观察到,现有文献有很多需要提升的地方,如:1)缺乏一种动态融合机制来有选择地整合和改善图的结构和节点属性信息以进行共识表示学习; 2)未能利用双方提取的信息进行鲁棒目标分布生成(可以理解为DEC中的soft labels分配)。为了解决上述问题,论文提出了deep fusion clustering network (DFCN)。具体地说,该网络中,提出了一个基于相互依赖学习(interdependency)的结构与属性信息融合(SAIF)模块来显式地合并由自编码器和图自编码器学习的表示,以实现共识表示学习。同时,设计了可靠的目标分布生成措施和三重自我监督策略,以促进跨通道(跨模式)信息的开发。在六个基准数据集上的大量实验表明,所提出的DFCN的性能始终优于最新的深度聚类方法。
在Introduction中,提到了几何结构信息,推测指的是数据分布所隐含的形状、大小、图形的相对位置等空间区域关系以及空间形式的度量等信息。

文章切入点:1)现有方法缺乏跨通道(跨模式)的动态信息融合和处理机制。来自两个来源的信息只是简单地对齐或连接在一起,导致信息交互和合并不足。2)现有文献对目标分布的产生很少使用两种来源的信息,这使得网络训练中的指导较不全面和准确。
这种不足使得两个信息源之间的“协商”受阻,导致聚类性能不如意。

贡献点
  • DFCN,设计了结构与属性信息融合(SAIF)模块,以更好地实现AE与GAE之间的信息交互。使用该模块,1)由于AE和GAE的解码器都使用共识潜在表示来重构输入,潜在嵌入的泛化能力得到了提高。2)通过整合AE和GAE之间的互补信息,提高了生成的目标分布的可靠性。3)三重自监督学习机制将AE、GAE和融合模块的学习集成在一个统一且健壮的系统中,从而进一步提高了聚类性能。
  • 开发了对称图自动编码器,即改进的图自动编码器(IGAE),以进一步提高所提出方法的泛化能力。
  • 实验结果敲好!
模型浅析

首先给出模型的对比图

改进为对两种结构信息都进行重构,构造融合模块打通两个来源渠道的抽取信息,三重自监督机制。
关于模型中符号的定义也分为约定俗成的输入部分(绿框),以及模型中生成的输出两部分。

Fusion-based Autoencoders

1)解码器的输出不再是相互独立的,而是通过整合来自AE和GAE的潜在表示共同作为两个子网的重建输入信息。
2)为了更好地利用邻接信息和属性信息,设计了一个对称的改进图形自动编码IGAE,同时重建节点属性信息和邻接结构信息。
优化目标:

Structure and Attribute Information Fusion

该模块SAIF是为了充分探索由IGAE和AE所学习到的图结构和节点属性特征。

SAIF

four-step:

  1. 对AE和IGAE的嵌入特征的组合(Addition):Z_I = \alpha Z_{AE} + (1-\alpha) Z_{IGAE}, Z_I \in R^{N*d}
    \alpha初始化为0.5,并可进行学习
  2. 使用类似图卷积的运算(Message Passing)来处理组合信息Z_I得到增强后的局部结构信息
    Z_L = \widetilde{A}Z_I
  3. 利用自相关的学习机制,以利用样本之间的初步信息(Z_L)融合空间中的非局部关系。
    先计算自相关系数矩阵S \in R^{N*N}:
    S_{ij} = e(Z_LZ_L^T)_{ij}/ \sum_{k=1}^Ne(Z_LZ_L^T)_{ik}
    因此可以得到样本间的全局关系表示:Z_G = SZ_L
  4. 采用跳跃连接来鼓励信息在融合机制中顺利通过:
    \widetilde{Z} = \beta Z_G + Z_L\beta初始化为0
Triplet Self-supervised Strategy

为了生成更可靠的聚类网络训练指导,因此我们使用了包含全局信息和局部信息的\widetilde{Z}。并利用该信息生成软分配Q \in R^{N*K},并由此生成目标分布P \in R^{N*K};同时在迭代生成P的过程中增加对IGAE和AE模块软分配的约束。三种自监督的优化目标为:

在此公式中,AE,IGAE的软分配分布的总和以及融合表示与稳健的目标分布同时对齐。由于目标分布是在没有人工指导的情况下生成的,因此我们将损失函数称为三元组聚类损失及其相应的训练机制作为三元组自我监督策略。

Joint loss and Optimization
image.png
模型整体感受

总体来说,模型从重建SDCN中涉及到的两个特征学习模块出发,通过设计局部及全局信息学习策略,构成更全面的指导信息参与到整个聚类训练过程中,并由三重自监督机制同时进行优化。

实验部分结构
  • Benchmark Datasets
  • Experiment Setup(Training Procedure、Parameters Setting、Evaluation Metric)
  • Comparison with the State-of-the-art Methods
  • Ablation Studies(Effectiveness of IGAE、Analysis of the SAIF Module、Influence of Exploiting Both-source Information)
  • Analysis of Hyper-parameter
  • Visualization of Clustering Results
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 214,875评论 6 496
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,569评论 3 389
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 160,475评论 0 350
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,459评论 1 288
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,537评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,563评论 1 293
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,580评论 3 414
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,326评论 0 270
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,773评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,086评论 2 330
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,252评论 1 343
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,921评论 5 338
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,566评论 3 322
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,190评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,435评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,129评论 2 366
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,125评论 2 352

推荐阅读更多精彩内容