Koch, Gregory, et al. Siamese Neural Networks for One-Shot Image Recognition. 2015.
一、论文发表信息:
这是发表在ICML-2015的一篇文章。
二、论文主要内容:
首先,训练一个用于图片验证的siamese网络,分辨两张图片是否属于同一类。然后在测试时,siamese网络把query set测试输入和support set里面的所有图片进行比较,选择相似度最高的那张图片所属的类作为输出。
首先,卷积siamese网络学习一个由多个卷积层组成的embedding函数fθ ,把两张图片编码为特征向量。两个特征向量之间的L1距离可以表示为 |fθ(xi)−fθ(xj)| 。通过一个linear feedforward layer和sigmoid把距离转换为概率。这就是两张图片属于同一类的概率。loss函数就是crossentropy loss。
在这里存在一个假设:学到的embedding在未见过的分类上依然能很好的衡量图片间的距离。这个假设跟迁移学习中使用预训练模型所隐含的假设是一样的。但实际上当新任务与旧任务有所差别的时候,预训练模型的效果就没有那么好了。
三、总结
这篇文章使用的是metrics-based的meta-learning方法,本质上与此前学习的prototypical network是一样的。
对于metrics-based的meta-learning的方法而言,可以形式化为以下:
基于度量的元学习的核心思想类似于最近邻算法。这类方法在已知标签的集合上预测出来的概率,是support set中的样本标签的加权和。 权重由核函数(kernal function)kθ 算得,该权重代表着两个数据样本之间的相似性。