About this paper
- Title: Maximum Classifier Discrepancy for Unsupervised Domain Adaptation
- Authors:Kuniaki Saito, KoheiWatanabe, Yoshitaka Ushiku, and Tatsuya Harada
- Topic: Domain Adaptation
- From:CVPR 2018
Background
目前解决无监督领域自适应(Domain Adaptation)的一类主要方法是对抗学习,这类方法的思想主要来源于生成式对抗网络(GAN)。
这类方法主要包括三部分
- 域分类器(Domain Classifier)
- 标签分类器 (Label Predictor)
- 特征生成器(Feature Generator)
域分类器
来判断特征是来自源域(source domain)还是目标域(target domain)。
标签分类器
通过训练预测源域数据额类别标签。
特征生成器(feature generator)
有两个作用,一是通过训练正确的预测源域数据类别标签,二是尽量去欺骗域分类器,生成域分类器无法分辨的特征。
Motivation
作者提出这类基于对抗学习的方法有两个问题。
- 域分类器只是区分特征是来自源域还是目标域,没有考虑特定任务的类间决策边界。这样特征提取器会产生在决策边界附近的任意特征。
- 这类方法的目标是完全匹配两个不同域的特征分布。但是因为每个域都有自己特性,想做到这点是非常困难的。
下图左侧展示了之前的方法只是考虑对齐源域和目标域的整体分布,没有考虑目标域样本和特定任务分类边界的关系,导致目标域特征会出现在决策边界附近,造成错分类。
为了解决这些问题,作者提出了一种利用特定任务决策边界的方法来对齐源域和目标域的分布。
这个方法的主要思想是:最大化两个分类器输出的差异,来检测离源域比较远的目标域样本。特征生成器最小化这个差异来生成靠近源域的目标域特征。
Method
overall Idea
其实作者提出的方法也是一种对抗学习的方法,只是与之前的对抗学习方法不同的是,之前的方法是域分类器与特征生成器对抗。作者提出的方法是特定任务的分类器与特征生成器对抗。
作者提出的模型主要分有三个组成部分:两个与任务相关的分类器,还有一个特征生成器。