文章部分内容参考:机器之心Pro NeurIPS 2019 少样本学习研究亮点全解析
Few-shot Video-to-Video Synthesis
方向:视频合成,根据人体关键点姿态运动视频,合成真人的动作视频。
问题:对于合成某人真人运动视频要求模型有大量目标对象的图像来完成训练,对数据的需求量巨大;单个姿态到真人视频合成 vid2vid 模型通常只能合成训练集里包括的人体个体,无法生成不处于训练集中的人的运动视频,合成模型的表达能力有限。
方法:除了人体姿态的语义视频,额外增加了少量目标真人的图片作为模型测试阶段的额外输入。使用网络参数生成机制, 利用少量目标图片训练一个模块来生成网络参数。
Incremental Few-Shot Learning with Attention Attractor Networks
方向:图像分类,增量学习
问题:实际的应用场景中,会有持续的新增学习类别,且很难做到每个类别可用数据都充分且平衡。怎样固定记忆已学会的种类,同时更好的识别新增的少样本类别?
方法:基于元学习的注意力吸引网络,结合循环式反向传播,训练新增类别直到其收敛,之后在所有的分类类别(固有类别以及新增类别)上做分类性能评估。
Adaptive Cross-Modal Few-shot Learning
方向:图像分类,多模态(视觉和语言)
问题:当视觉信息或语义信息之一缺失的情况下,少样本分类学习由于样本数目的匮乏,提供到的信息很可能是有噪声同时偏局部的,很难区分类似的困难样本。
方法:自适应交叉混合的机制,在少样本学习的测试阶段独立地处理两个知识模块,同时根据不同场景区分适应性地利用两个模块信息。
Cross Attention Network for Few-shot Classification
方向:图像分类
问题:现有的许多方法都是从标记和未标记的样本中独立提取特征,导致特征的区分性不够。
方法:交叉注意力网络模型,通过注意力机制建立待分类类别特征与查询样本之间的联系,并且突出目标个体所在区域。一种直推式学习的半监督推理,来解决少样本的数据缺乏困境。
Meta-Reinforced Synthetic Data for One-Shot Fine-Grained Visual Recognition
方向:细粒度视觉分类
问题:使用现成的图像生成器来合成额外的训练图像,往往无助于提高少样本细粒度识别的准确率。
方法:生成网络合成图像数据,利用元学习的方法将其于真实数据混合,使用元图像增强网络模型训练。
Dual Adversarial Semantics-Consistent Network for Generalized Zero-Shot Learning
方向:视觉识别,泛化零样本学习
问题:现有方法在嵌入阶段存在语义丢失和区分性信息丢弃问题,或者无法保证视觉-语义交互。
方法:双重对抗式语义一致性网络,用其学习原生 GAN 与其对偶的 GAN 网络,从而达到更好的任务识别效果。
Unsupervised Meta-Learning for Few-Shot Image Classification
方向:图像分类
问题:元学习要求学习任务与目标任务具有相同的监督学习模式,获取大量任务的标记数据不仅是成本和方便的问题,对通过元学习可以解决的问题类型也有概念上的限制。
方法:提出UMTRA,执行无监督且模型无关的元学习算法,解决分类任务。
Transductive Zero-Shot Learning with Visual Structure Constraint
方向:视觉识别,零样本学习
问题:零样本学习容易在数据分布的源域到目标域的映射过程中出现领域偏移问题。
方法:观察到测试样例的视觉特征可以被划分为不同的簇,提出基于类中心的视觉结构约束,以提高投影函数的泛化性,采用三种策略来对齐测试样例的投影不可见语义中心和视觉聚类中心。另外提出一种训练策略来处理测试数据集中存在许多不相关图像的实际情况。
Order Optimal One-Shot Distributed Learning
方向:分布式学习
问题:分布式统计优化
方法:多决策估算算法
Learning to Self-Train for Semi-Supervised Few-Shot Classification
方向:图像分类
问题:半监督少样本分类任务
方法:提出一种半监督元学习方法,自训练学习
Zero-shot Learning via Simultaneous Generating and Learning
方向:零样本学习
问题:不可见类别训练数据缺乏
方法:可见类和不可见类的条件生成模型