Zhang P, Wang S, Hu J, et al. Adaptive Weighted Graph Fusion Incomplete Multi-View Subspace Clustering[J]. Sensors, 2020, 20(20): 5755.
摘要翻译
随着各种传感器和特征提取方法产生大量的多源数据,多视图聚类(MVC)引起了研究的关注,并在数据分析中得到了广泛的应用。大多数现有的多视图聚类方法都假设所有的视图都是完整的。然而,在许多真实的场景中,由于许多原因,多视图数据往往是不完整的,例如,硬件故障或不完整的数据收集。本文提出了一种自适应加权图融合不完全多视图子空间聚类(AWGF-IMSC)方法来解决不完全多视图聚类问题。首先,为了消除原始空间中存在的噪声,作者将完整的原始数据转换为潜在的表示,这有助于更好地构建每个视图的图。然后,我们将特征提取和不完全图融合纳入到一个统一的框架中,而两个过程可以相互协商,用于图形学习任务。对完整图进行稀疏正则化,使其对视图不一致性更有鲁棒性。此外,还可以自动学习不同视图的重要性,进一步指导了完整图的构建。在最后提出了一种有效的迭代算法来求解具有收敛性的优化问题。与现有的现有方法相比,在多个真实数据集上的实验结果证明了该方法的有效性和先进性。
主要贡献
- 在得到潜在空间后,引入相似图融合,提取内视图的局部结构。因此,可以在潜在空间中消除原始空间中存在的噪声,有助于更好地构造图。
- 它将缺失的样本和完整的样本之间的关系合并到完整的图中。对完整图施加的稀疏约束改善了视图的不一致性,减少了视图之间的差异,使该方法在大多数情况下更加鲁棒。
- 在优化过程中,每个视图的重要性都会被自动地学习和自适应地优化。因此,重要的观点在学习过程中有很强的指导。此外,该方法适用于任何多视图数据集。
模型学习
作者将局部结构包含图与自适应视图重要性学习相融合,是一种新的不完全多视图聚类方法。并且将不同尺度的不完全图融合成一个具有自动学习权值的完整图。并在在进行更新时,所构造的完整图将进一步指导不完全图和潜在表示的学习过程。
符号说明
注:粗体字母表示矩阵和向量。
符号 | 说明 |
---|---|
矩阵 | |
矩阵的第列 | |
矩阵第行和第列的元素 | |
矩阵的转置 | |
矩阵的迹 | |
矩阵的逆 | |
Frobenius范数 | |
范数 | |
矩阵中的负元素都换成 | |
多视图数据表示 | |
每一列代表一个样本,为数据集的样本数,为当前视图特征维数 |
- 模型介绍
对于不完整的多视图数据,作者的做法是将每个视图的表示中那些不完整的样本数据进行移除表示为一个的矩阵。假设输入数据的矩阵分解可以得到基矩阵,以及一个系数矩阵。其中是目标隐藏空间的维数,通常设置为的簇的数量。考虑到每个视图中缺失的样本不同,因此学习每个视图中相应可见样本的潜在表示是十分必要的。因此,在该框架中,每个视图的重构就可以形式化为如下公式:
并且为了约束视图内的相似结构和潜在的子空间结构,作者还对潜在表示使用了自表示属性来构建图。
其中,关于的两条约束是为了对其有更好的概率解释。
由此约束,可以为每个特定的视图得到不同的图表示。在获得每个视图上的图后,自然的想法是将多个不完整的信息整合成一个完整的信息。为了建立不完整的图和完整的图之间的对应关系,这里声明了一个索引矩阵。该索引矩阵可以从完整视图中提取视图中的可见实例得到。即:
通过这个索引矩阵,可以实现完整图和非完整图之间的转换,
通过这种处理方法,由于图的大小和视图之间的相似度大小存在差异,直接将多个图相加是不合理的。因此,接下来的目标是将多个信息整合到一个具有自适应学习权值的完整图中。借助索引矩阵,可以从中提取相关元素。然后,可以自适应地将多个融合成一个具有自动学习权值(它被自动学习和优化,以说明第个视图的重要性。)的完整图:
其中,和是非负的权衡参数。总的来说,在提出的框架中,包含四个术语:(1)使用semi-NMF来获取潜在的视图表示,(2)通过自表示来构建图,(3)自适应融合以及(4)稀疏正则化。最终,得到了个包含潜在子空间中所有样本信息的全尺寸图。
更新部分实在是能力有限。。