《Dynamic Classifier Alignment for Unsupervised
Multi-Source Domain Adaptation》
摘要
如论文名,DCA是在无监督的多源域领自适应中,每个域采用多视角,以丰富迁移信息。通过一种sample-wise的自动对齐方式在每个源域上对齐各个视角训练出的分类器。
本文特点:
- 通过辅助分类器生成的学习函数学习各视角的重要性,作为单个源域上联合各视角分类器时的权值。
- 以域鉴别器评估出的样本属于源域的概率,作为联合源域时的权值
- 一个自学习战略,通过伪标签的帮助加强源域分类器的跨域能力
前人不足
之前使用多视角特征的DA(领域自适应)方法
view方面
对于多视角特征的处理方法,或者在公共空间中合并特征,或者简单地连接特征而忽视了视角相关的信息或每个视角的重要性。
domain方面
试图在所有域上学习一个通用的分类器,但可能不存在对于所有域的公共特征空间。
三个主要贡献
①学习每个视角的特征的重要性,以确保merge 预测时,主导特征有更大的作用。
②自训练战略:选择训练师有高置信度的伪标签
通过迭代地靶目标域分为训练和测试集,以提高元分类器的跨域能力
③一种自动的基于样本的方法,用来学习 连接不同视角、不同分类器的预测结果的权重
算法主要介绍

DCA总框架.png
总体框架如上图,它包括特征提取、分类器对齐、伪标签选择和目标任务完成。
特征提取收集共享特征和特定于视角的多视角特征。其中,共享源特征用于学习识别样本属于源域的概率的域鉴别器,而自适应的特定多视角特征用于训练一系列分类器。通过线性混合从不同视角学习的多个分类器,生成每个源域的辅助分类器,然后基于该辅助分类器生成一个重要性学习函数,以学习多视角特征 在对齐分类器时的重要性权值。同时,学习分类器会提供伪标签来监督进一步的训练。使用共享特征训练的领域鉴别器计算出的目标样本属于源域的程度,最终组合源域分类器来预测目标标签。
关于自训练战略

伪标签选择.png
一开始仅用源域样本训练分类器,并预测未标记的目标域样本。之后根据预测结果,将目标域样本分为高置信样本和低置信样本。低置信样本被各个分类器预测为不同结果,或者预测为相同结果但置信度低。高置信样本是被预测为相同结果且置信度高。之后将高置信样本用于下一轮的训练的监督,再重新对置信集进行分类。

公式(8).png
∧是选择具有相同预测结果的目标域样本的操作。公式(8)表明这里根据的是每个域的每个视角训练出的分类器的结果。