论文阅读“Contrastive and View-Interaction Structure Learning for Multi-view Clustering”

Wang J, Feng S. Contrastive and View-Interaction Structure Learning for Multi-view Clustering[J]. IJCAI2024

论文链接:https://www.ijcai.org/proceedings/2024/0559.pdf

摘要简述

现有的多视图方法大多聚焦于捕获多个视图之间的共识语义信息,其中对比学习广泛应用于各视图表示的对齐。然而,视图特有表示提取自对应样本的内容信息,而忽略了视图样本之间的关系。此外,目前的对比损失构造中引入了大量错误的负例样本,这一点与多视图聚类任务的目标是相矛盾的。对应对以上问题,作者提出了服务于多视图聚类任务的对比和视图交互的结构学习框架SERIES。提出的方法考虑了样本之间的结构关系,促使对比损失可以提升类簇内的紧凑性。同时,引入了一个跨视图的双重关系生成机制用于获取多视图之间共识结构图,然后用于谱聚类。细化到模型的设计上,首先通过多个图自编码器利用样本的内容信息和结构信息获取各视图特定表示。进一步,为了将同一类簇的样本聚合在一起,设计了软负例对感知的对比损失使得不相似的样本远离,相似的样本靠近。在此之后,视图特定表示输入到跨视图双重关系生成的网络层中产生亲和矩阵,以学习多视图之间一致的结构图。

模型浅析

整体来说,提出的模型包含三个子模块,首先是一系列的图自编码器,利用样本的内容信息和结构信息获取视图特有表示;接着是软负例感知的对比学习模块,用于实现对假负样本的顾虑;得到的视图表示输入到跨视图双重关系生成模块中,利用多个视图的信息来产生视图特有的亲和矩阵,辅助探索一致的拓扑结构图。

  • 视图特定的深度图自编码器
    这里需要说明的是,在每个视图中使用k-NN来构造初始的视图亲和矩阵。图自编码器的结构这里不进行赘述。该模块最终的损失函数包含对内容表示X以及对结构表示A的重构两部分:
  • 软负例对感知的对比学习模块
    对比学习在多视图的应用通常将来自同一样本的不同视图的表示进行对齐,以学习对应的具有区分性的特征。即:对于多视图数据的mn个样本\{X_1^1,\cdots,X_i^1, \cdots, X_i^m, \cdots, X_n^m\},一般对比学习将(X_i^v;X_i^u)作为正例样本对,而其余mn-m个样本都为负例样本。显然,这种操作可能会将来自同一个类簇的样本看做负例样本,这一点和聚类的目标并不相符。现有的做法是引入伪标签,将错误的负例剔除出去,但是在训练的过程中很难获取到高置信度的标签,这会影响到最终的性能。
    与之相反,作者提出了软负例对感知的对比损失,目的是将关联的样本推进而不相关的样本远离。具体来说,作者设计了一个权重调节函数\rho(\cdot, \cdot)动态地调节样本对之间权重,给定的形式如下:
    潜在的视图表示z_i^v通过视图共享的映射头过滤视图其中的噪声。s(h_i^v,h_j^p)=(h_i^v)^Th_j^p\beta \in [1, 5]是一个惩罚因子用于调节关联样本和非关联样本的度。例如,\beta=2,关联样本的相似度为s=0.8,此时对应的权重为0.04。依据上述定义的函数,视图v和视图u之间的软负例对感知对比损失如下:
    全视图的对比损失为:
  • 跨视图双关系生成模块
    为了进一步的融合多视图间的互补信息,作者通过设计夸视图双关系生成模块来产生各视图的亲和矩阵,更好地挖掘一致的拓扑结构图。该模块包含两个生成层(双层非线性全连接层{256,d_v}):
    (1)自关系生成层SR(\cdot):给定视图v,其目的是利用视图v的其他样本来表示给定样本。其生成过程可形式化为:
    并且为了挖掘给定视图的全局结构,其对应的损失如下:

    (2)双关系生成层DR^u(\cdot):该层利用不同视图之间的互补信息来生成跨视图的亲和矩阵G^{(u,v)},即利用视图u的关系生成层来生成v的潜在表示。其对应的损失为:
    给定视图v,该模块的整体损失为上述两个关系生成层的损失之和:
    同时可以计算视图v的亲和矩阵:
    而在论文中,最终的共识亲和矩阵通过简单的权重平均获得:
  • 提出模型的整体损失
    在训练阶段,视图特定图自编码器、软负例对感知的对比学习模块以及双关系生成模块由下述目标函数进行联合训练:
    模型的最终聚类结果使用的是对共识亲和矩阵\overline{S}进行谱聚类。模型首先需要通过多个图自编码的预训练过程进行模型权重的初始化(200epochs);在微调阶段使用最终的联合损失进行共识亲和矩阵的学习(100epochs);并在其上应用谱聚类算法获得聚类结果。
实验观察

笔者这里主要观察了该模型的消融实验,为了突出模型的创新点,作者从整体模型的角度对三个方面进行了消融:(1)消去双关系生成的损失(SERIES-D);(2)消去软负例对感知损失(SERIES-SC);(3)将软负例对感知损失替换为普通的对比损失。其对应的消融结果如下:

emmmm,确实应该是有效的,但是作者在论文的分析和指标中出现了一些笔误,如
显然不是低于SERIES-SC,其实笔者这里理解的直接和完整的模型SERIES对比就可以了。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 213,014评论 6 492
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,796评论 3 386
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 158,484评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,830评论 1 285
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,946评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,114评论 1 292
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,182评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,927评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,369评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,678评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,832评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,533评论 4 335
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,166评论 3 317
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,885评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,128评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,659评论 2 362
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,738评论 2 351

推荐阅读更多精彩内容