Fang U, Li M, Li J, et al. A Comprehensive Survey on Multi-view Clustering[J]. IEEE Transactions on Knowledge and Data Engineering, 2023. 论文链接
论文导读
对Multi-view clustering (MVC)做文献综述,主要包括两种方法:
- heuristic-based multi-view clustering (HMVC)
- nonnegative matrix factorisation
- graph learning
- latent representation learning
- tensor learning
- neural network-based multi-view clustering (NNMVC)
- deep representation learning
- deep graph learning
我们主要关心的是基于神经网络的方法。
MVC介绍
MVC一般的过程包含如下几个部分:输入,提取特征,根据每个view聚类,最终得到聚类结果。
努力的方向有:consensus的构造,聚类结果的融合,区分view间的不同,分配view间的权重。
1. Deep Representation Learning
针对深度表示学习,主要介绍了下面三种方法:
SplitAE
W. Wang, R. Arora, K. Livescu, and J. Bilmes, “On deep multi-view representation learning,” in International conference on machine learning. PMLR, 2015, pp. 1083– 1092.
作者构造了共享的特征提取器,并分view构造了不同的重构网络,其损失函数如下:
DCCA
引入了典型关联分析canonical correlation analysis,让两组高维数据的相关度最大(投影到一维后,相关系数最大)。分别用两个特征提取器提取不同维度的特征,之后计算损失函数:
DCCAE
把前两个方法结合起来,既有不同的特征提取器,又有不同的特征重构,损失函数也为二者的结合:
2. Deep Graph Learning
关于图的方法共介绍了两种,都是基于single-view的,然后根据特性生成多个view,也可以直接用在多视角的数据上。
样本间关系网
对应于图中的a。不同的颜色代表不同的样本。single-view数据集,获得affinity graph后,通过增强得到两个视角的graph views,再利用不同的特征提取器提取特征,用相同的特征做还原,然后最大化MI:
多视角构成多个网络
对应于图中的b。不同颜色代表不同的graph view。使用同一个 特征提取器提取特征,再用相同的网络还原,最后计算损失函数,与a中的不同: