《Siamese Neural Networks for One-Shot Image Recognition》学习笔记

Koch, Gregory, et al. Siamese Neural Networks for One-Shot Image Recognition. 2015.

一、论文发表信息:

图1 论文基本信息

这是发表在ICML-2015的一篇文章。

二、论文主要内容:

        首先,训练一个用于图片验证的siamese网络,分辨两张图片是否属于同一类。然后在测试时,siamese网络把query set测试输入和support set里面的所有图片进行比较,选择相似度最高的那张图片所属的类作为输出。

图2 卷积siamese网络用于few-shot image classification的例子

        首先,卷积siamese网络学习一个由多个卷积层组成的embedding函数 ,把两张图片编码为特征向量。两个特征向量之间的L1距离可以表示为 |(xi)−fθ(xj)| 。通过一个linear feedforward layer和sigmoid把距离转换为概率。这就是两张图片属于同一类的概率。loss函数就是crossentropy loss。

        在这里存在一个假设:学到的embedding在未见过的分类上依然能很好的衡量图片间的距离。这个假设跟迁移学习中使用预训练模型所隐含的假设是一样的。但实际上当新任务与旧任务有所差别的时候,预训练模型的效果就没有那么好了。

三、总结

        这篇文章使用的是metrics-based的meta-learning方法,本质上与此前学习的prototypical network是一样的。

图3 原型网络训练示意图    

        对于metrics-based的meta-learning的方法而言,可以形式化为以下:

        基于度量的元学习的核心思想类似于最近邻算法。这类方法在已知标签的集合上预测出来的概率,是support set中的样本标签的加权和。 权重由核函数(kernal function) 算得,该权重代表着两个数据样本之间的相似性。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容