论文阅读“Auto-weighted multi-view clustering via deep matrix decomposition”

摘要:
实际数据通常是从多个渠道收集或由不同的表示形式(即视图)组成。多视图学习提供了一种优雅的方法来分析多视图数据以进行低维表示。近年来,已经设计了几种多视图学习方法并将其成功应用于各种任务。但是,现有的多视图学习方法通​​常以单层公式(a single layer formulation)表示。由于获得的表示形式和原始数据之间的映射,包含具有隐式较低级隐藏属性(implicit lower-level hidden attributes)的相当复杂的层次结构信息,因此希望对层次结构进行全面探索。

本文通过分层揭示输入数据的层次语义,提出了一种新颖的深度多视图聚类模型。通过利用新颖的协作式深矩阵分解框架,可以针对不同属性学习隐藏表示。所提出的模型能够协同学习由每一层获得的分层语义。来自同一类的实例在低维空间中被迫逐层靠近,这对于后续的聚类任务是有利的。此外,一个理想权重将自动分配给每个视图,而不会像以前的方法那样引入额外的超参数。

为解决模型的优化问题,提出了一种有效的迭代更新算法,并在理论上保证了其收敛性。我们对多视图聚类任务的实证研究表明,与最新算法相比,我们模型的结果令人鼓舞。

tag: Multi-view learning has been successfully applied in face recognition, image classification, text mining, etc. Since graph-based methods suffer from the problem of time-consuming due to the graph construction as well as the eigen decomposition, more and more researchers focus on applying the MF strategy to solve the multi-view learning problems.

该模型的两个关注点:
(1) 基于MF的工作通常以单层公式工作,获得的表示形式与原始数据之间的映射包含复杂的层次结构,因此作者想利用多层结构去获取不同的低维的数据隐藏属性。As a result,来自同一类别但来自不同视图的实例在低维空间中被迫逐层靠近
(2) 基于分层揭示输入数据的层次语义,为不同数据视图分配不同的权重,与聚类任务相匹配对应。

Three deep MF structures.png

模型图注解
相同的形状表示实例属于同一类。我们可以看到面部数据的可变性可能源于诸如对象的姿势(左眼,右眼或前眼)或面部表情(带有或不带有微笑)的属性。通过利用所提出的深层结构,可以完全充分利用视图所共享的分层信息。最后,生成更具判别力的表示形式(like the representation show in 3rd layer)。


(NMF) 给定非负数据矩阵

nonnegative data matrix.png
其中,n是样本数量,f是样本数据的维度。
NMF的目的是寻找
U and V.png
来最小化目标函数
J_NMF.png
在关于NMF的聚类设置中,U表示基础矩阵,V则代表学习的表示矩阵,C为隐藏属性表示的维数。因为C<<n且C<<f,因此得到V可以看做是X的降维表示。
先前的研究表明NMF等同于宽松的k均值聚类,这是一种基于质心的方法,仅适用于单视图数据聚类。传统的NMF无法完全发现这些因素的隐藏结构。
数据矩阵的多层分解过程可以表示为:
multi-layer decomposition process.png
通过引入深度分解过程,意在自动了解数据的潜在属性层次结构。换句话说,通过引入额外的抽象层来最小化获得的表示的维数,可以自动利用相应的潜在属性以及隐含的中间隐藏表示,从而获得更好的更高级别的表示Vr(top层的表示结果)。
整篇文章的目的在于:将传统的MF模型扩展到用于学习多视图聚类的新型深度矩阵分解框架。

问题的形式化

  • 目标函数(共包含M个视图的多视图数据)
object-func.png

相对于多层深度矩阵分解的思路而言,这里可以相当于是对M个视图进行同时的学习约束的过程,因此目标函数是M个视图的求和操作,每个视图有对应的约束条件。由作者的想法而言,其目的是为了在学习的过程中,我们可以在M个视图中得到共同的、唯一一个Vr可表示不同的视图。

  • 自动加权深度MF多视图聚类(Auto-weighted deep MF multi-view clustering)
    首先作者提出了一个新奇的模型用于多视图聚类
no weight obj func.png

从上述定义可以看出此时未考虑不同视图之间的权重,或者可以说所有视图的权重都是1。当我们将权重参数假设为固定值(不依赖于Vi^(m) and Ui^(m))的时候,可利用在公式(5)的方法都可以自然的应用到如下设定中,

the weights are stationary.png

作者此时使用了公式(9)来更新Vi^(m) and Ui(m),此时a(m)的值也可以进一步更新,并启发我们使用迭代的方式去优化公式(5)。

  • 优化方式
    作者提出了一种有效的迭代更新算法来解决等式的优化问题(9)。针对一个变量优化目标,同时固定其他变量。重复此过程,直到收敛为止。(有点像EM算法中的迭代)
    我们需要为每个视图都进行预训练来初始化分解过程。注意,预训练过程可以通过简单地使用k-means来完成,因为松弛k-means等效于矩阵分解法。重复该过程,直到所有层都经过预训练为止。
param update.png

在文章中,作者用了很多巧妙的替换,使得过程变得容易让人接受。读来循序渐进,同时如果我们想将多视图聚类和矩阵分解结合的话还需要补充学习很多相关的数学知识。
关于toy data很有趣的展示。

toy data show.png
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 204,445评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,889评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 151,047评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,760评论 1 276
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,745评论 5 367
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,638评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,011评论 3 398
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,669评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,923评论 1 299
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,655评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,740评论 1 330
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,406评论 4 320
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,995评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,961评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,197评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,023评论 2 350
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,483评论 2 342

推荐阅读更多精彩内容