论文阅读“Scalable Multi-view Subspace Clustering with Unified Anchors”

Sun M, Zhang P, Wang S, et al. Scalable Multi-view Subspace Clustering with Unified Anchors[C]//Proceedings of the 29th ACM International Conference on Multimedia. 2021: 3528-3536.

摘要翻译

多视图子空间聚类在多媒体应用中有效融合多视图信息方面受到了广泛的关注。考虑到大多数现有方法的立方时间复杂性使其应用于现实的大规模场景具有挑战性,一些研究人员通过对锚点进行采样以捕获不同视图中的分布来解决这一挑战。然而,启发式抽样和聚类过程的分离导致了弱区分锚点。此外,互补的多视图信息由于锚独立构建的,还没有得到很好的利用。为了解决这些问题,我们提出了一个具有统一锚点的可伸缩的多视图子空间聚类(SMVSC)。具体来说,将锚点学习和图构造结合成一个统一的优化框架。因此,学习到的锚点可以更准确地表示实际的潜在数据分布,从而产生更具鉴别性的聚类结构。
最重要的是,作者提出的算法的线性时间复杂度允许多视图子空间聚类方法应用于大规模数据。并设计了一个具有证明收敛性的四步替代优化算法。与目前最先进的多视图子空间聚类方法和大规模定向方法相比,在多个数据集上的实验结果表明,SMVSC方法更有效地实现了类似的或更好的聚类性能。

Mark:基于锚点的MVSC来缓解传统子空间方法的高复杂度。该方法通过独立采样𝑘选定的地标,将大小为𝑛×𝑛的原始全局图替换为大小为𝑛×𝑘的相应锚点图。将锚图融合成共识图,然后进行谱聚类,得到最终聚类结果。基于锚点的子空间方法的整个时间复杂度在每次迭代中降低到O(𝑛),可以应用于大规模任务。


传统基于锚点的多视图子空间聚类方法

其步骤主要分为三个阶段:
第一阶段,启发式地选择锚点,然后通过从每个视图中的原始数据中采样来固定。
第二阶段,锚定图独立于每个视图构建,没有信息交换。
最后,将特定于视图的锚图直接平等地连接成一个统一的锚图。
但是三个阶段相互独立,视图之间没有相互作用。对于多视图探索不一致性信息不友好。

依据上述不足,作者提出将锚点学习和图构造结合成一个统一的框架,其中共识锚点(来自各视图)与各自的视图排列矩阵共同优化。因此,学习到的锚点可以准确地表示实际的潜在数据分布,从而实现更好的图结构构造。每个视图的重要性也可以通过个体视图对统一图的贡献来自适应地衡量。

模型浅析
base model

给定多视图数据\{X_i\}_{i=1}^v \in R^{d_i × n},其中,𝑑_𝑖是第𝑖个视图中的维特征,𝑛是样本的数量。典型的多视图子空间聚类框架为:

𝛀指的是可以在不同视图之间共同训练全局图的共识正则化术语。在得到融合全局图S后,通过对S进行谱聚类得到最终的聚类结果。

SMVSC

不同于使用全局样本来表示每一个数据点,作者采用锚点策略来选择一组称为锚点或地标的较少数据点来重构底层子空间并捕获流形结构。在现有做法中,锚点的选择可以通过从原始数据空间随机采样或使用𝑘-means获得的聚类中心来获得。

然而,在之前的策略中,锚一旦初始化就被固定,使得锚点学习与图构造隔离。该算法将这两个过程集成到一个共同的框架中,以学习更具有区别性的锚点。此外,从独立的视图生成的锚点将导致不同的锚点集,使图融合变得困难。而视图之间的补充信息还没有得到很好的探索。鉴于这些问题,作者通过投影的统一锚自适应地学习一个公共图,从而得到一个具有互补视图信息和判别锚定结构的统一锚图。
SMVSC

因此作者构造了如下的目标函数:

其中,X_𝑖 ∈ R^{𝑑_𝑖×𝑛}是第i个视图的原始数据的特征表示,d_i是对应视图的维度,n是样本数。A∈R^{𝑑×𝑚}是统一的锚点矩阵,其中𝑑是视图的公共维度,𝑚是设定的锚点数量。在该论文中,作者使用数据集的真实类簇个数k为公共维度,并且设置锚点的数目为\{k,2k,3k\}。公共维数和正交约束的限制使得A更具鉴别性。W_𝑖是第𝑖个视图中的锚点投影矩阵,它可以将统一的锚点投射到相应的原始数据空间中。Z𝑚×𝑛维数的统一锚点图。(这里作者的想法是使用一个共享的锚点矩阵A和锚点图Z,每个视图都学习一个锚点投影矩阵W_𝑖,通过该矩阵与锚点矩阵及锚点图的运算,可以还原每个视图的原始数据特征空间。)

由前序文献的结论,锚点图Z的左奇异向量等于全图的左奇异向量,即:

因此,通过在Z上进行SVD得到左奇异向量U,并对U执行𝑘-means得到最终结果。

关于优化

当同时考虑所有变量时,等式(2)中的优化问题并不是共同凸的。因此,作者提出了一种交替算法来进行优化。即:使用控制变量法,在其他变量固定的情况下对剩余变量进行优化。

  • W_i的更新
    A, Z以及\alpha_i固定时,目标函数可以写作关于W_i的优化:

    因为每个W_𝑖在相应的视图上是独立的,通过trace来扩展 Frobenius norm并移除与W_i无关的项。
    Frobenius norm

因为W_i所在项有负号,所以上式可以等价为最大化问题:

  • A的更新
    关于A的优化可以转化为如下:

    同样,该问题也可以转换为:
  • Z的更新
    关于Z的优化问题:

    将其使用二次规划(QP)进行转换,可以得到:
  • \alpha_i的更新

随着迭代的进行,上述优化中的四个变量分别用其他变量求解。由于每个子问题都是严格凸的,目标值会单调减小,直到找到最小值或达到收敛条件。


关于矩阵推导的公式


最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 213,417评论 6 492
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,921评论 3 387
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 158,850评论 0 349
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,945评论 1 285
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,069评论 6 385
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,188评论 1 291
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,239评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,994评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,409评论 1 304
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,735评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,898评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,578评论 4 336
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,205评论 3 317
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,916评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,156评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,722评论 2 363
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,781评论 2 351

推荐阅读更多精彩内容