《Siamese Neural Networks for One-Shot Image Recognition》学习笔记

Koch, Gregory, et al. Siamese Neural Networks for One-Shot Image Recognition. 2015.

一、论文发表信息：

图1 论文基本信息

这是发表在ICML-2015的一篇文章。

二、论文主要内容：

首先，训练一个用于图片验证的siamese网络，分辨两张图片是否属于同一类。然后在测试时，siamese网络把query set测试输入和support set里面的所有图片进行比较，选择相似度最高的那张图片所属的类作为输出。

图2 卷积siamese网络用于few-shot image classification的例子

首先，卷积siamese网络学习一个由多个卷积层组成的embedding函数fθ ，把两张图片编码为特征向量。两个特征向量之间的L1距离可以表示为 |fθ(xi)−fθ(xj)| 。通过一个linear feedforward layer和sigmoid把距离转换为概率。这就是两张图片属于同一类的概率。loss函数就是crossentropy loss。

在这里存在一个假设：学到的embedding在未见过的分类上依然能很好的衡量图片间的距离。这个假设跟迁移学习中使用预训练模型所隐含的假设是一样的。但实际上当新任务与旧任务有所差别的时候，预训练模型的效果就没有那么好了。

三、总结

这篇文章使用的是metrics-based的meta-learning方法，本质上与此前学习的prototypical network是一样的。

图3 原型网络训练示意图

对于metrics-based的meta-learning的方法而言，可以形式化为以下：

基于度量的元学习的核心思想类似于最近邻算法。这类方法在已知标签的集合上预测出来的概率，是support set中的样本标签的加权和。权重由核函数（kernal function）kθ 算得，该权重代表着两个数据样本之间的相似性。

《Siamese Neural Networks for One-Shot Image Recognition》学习笔记

推荐阅读更多精彩内容