A Comprehensive Survey on Multi-view Clustering

Fang U, Li M, Li J, et al. A Comprehensive Survey on Multi-view Clustering[J]. IEEE Transactions on Knowledge and Data Engineering, 2023. 论文链接

论文导读

对Multi-view clustering (MVC)做文献综述,主要包括两种方法:

  1. heuristic-based multi-view clustering (HMVC)
  • nonnegative matrix factorisation
  • graph learning
  • latent representation learning
  • tensor learning
  1. neural network-based multi-view clustering (NNMVC)
  • deep representation learning
  • deep graph learning

我们主要关心的是基于神经网络的方法。

MVC介绍

MVC一般的过程包含如下几个部分:输入,提取特征,根据每个view聚类,最终得到聚类结果。


General procedures of MVC.

努力的方向有:consensus的构造,聚类结果的融合,区分view间的不同,分配view间的权重。

1. Deep Representation Learning

针对深度表示学习,主要介绍了下面三种方法:


Schema of deep multi-view representation learning models.
SplitAE

W. Wang, R. Arora, K. Livescu, and J. Bilmes, “On deep multi-view representation learning,” in International conference on machine learning. PMLR, 2015, pp. 1083– 1092.

作者构造了共享的特征提取器,并分view构造了不同的重构网络,其损失函数如下:


objective of SplitAE.
DCCA

引入了典型关联分析canonical correlation analysis,让两组高维数据的相关度最大(投影到一维后,相关系数最大)。分别用两个特征提取器提取不同维度的特征,之后计算损失函数:


objective of maximising canonical correlation.
DCCAE

把前两个方法结合起来,既有不同的特征提取器,又有不同的特征重构,损失函数也为二者的结合:


objective of DCCAE.

2. Deep Graph Learning

关于图的方法共介绍了两种,都是基于single-view的,然后根据特性生成多个view,也可以直接用在多视角的数据上。


General framework.
样本间关系网

对应于图中的a。不同的颜色代表不同的样本。single-view数据集,获得affinity graph后,通过增强得到两个视角的graph views,再利用不同的特征提取器提取特征,用相同的特征做还原,然后最大化MI:


MI 两视角.
多视角构成多个网络

对应于图中的b。不同颜色代表不同的graph view。使用同一个 特征提取器提取特征,再用相同的网络还原,最后计算损失函数,与a中的不同:


MI 多视角.
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容