Learning Semantic Representations for Unsupervised Domain Adaptation
参考博客https://blog.csdn.net/zhy455/article/details/84000056
来源:2018 ICML,中山大学数据科学与计算机学院,中山大学国家数字生活工程研究中心。
重要等级:标红加黄
所属类别:DANN based
数据集:Office-31,ImageCLEF-DA,MNIST-USPS-SVHN,本文做的对比实验,一些其他论文中出现的网络结构,本文直接用Long 等人的论文中的结果。
本文重复每个迁移任务3次,并且取accuracy的均值和标准差。
实现框架:tensorflow
实验的backbone:AlexNet
本文提出的网络结构作者起名为MSTN(moving semantic transfer network),文中还提出了它的一个变种。
一句话概括创新:为来自同一个类但是不同域的特征对齐提供了一种新方法: centroid alignment。
原域和目标域所属的分布是不一样的,域对抗方法通过对抗的方式来对齐原域和目标域的边缘分布,但是原域和目标域中,每一类(比如小车,背包)也都是有分布的,要把原域中的背包类所属的分布和目标域中背包类所属的分布对齐,之前的方法没有考虑这个对齐,故效果不好。本文采用为目标域样本加伪标签的方式,来对齐每一类的质心,这就是本文的创新之处。
优化目标如下:
这三项依次为classfication loss,domain confusion loss ,semantic loss.
本文和一般的域对抗方法的不同之处在于加了第三项损失LSM。
该语义损失函数用一个函数来衡量原域和目标域中属于同一类的样本的质心的距离。
这个损失函数和其他论文中见的不太一样,其他论文中是把log(DG(x))这一项放到原域那儿。
质心是在特征空间中计算的,计算质心需要样本的标签,但是目标域样本是没有标签的,故本文用训练出的分类器 f 来为目标域样本生成伪标签。
论文Progressive Feature Alignment for Unsupervised Domain Adaptation,也用到了伪标签,那篇论文中为目标域样本分配伪标签的方法和本文的不同,那篇论文是通过一个度量函数来计算不带标签的目标域样本和原域的C个(原域样本有C类)prototype(相当于本文的质心)C个度量值,然后取度量值最大的那一个prototype所属的类作为目标域样本的类。
从算法里可以看出,质心的计算方法为:把特征提取器提取出的同一类样本的特征取平均值,就得到了质心,这个质心是个D维的向量(文中没有提,我猜测出来的)