论文阅读(六)Prototypical Networks for Few-shot Learning

1.摘要

我们针对少样本分类问题提出了原型网络,其中一个分类器必须归纳为训练集中没有的新类,只给出了每个新类的一小部分示例。原型网络学习一个度量空间,在该空间中,通过计算到每个类的原型表示的距离,可以执行分类。与最近的少量样本学习方法相比,它们反映了一种更简单的归纳偏见,有利于这种有限的数据体制,并取得了良好的结果。我们提供了一个分析,表明一些简单的设计决策可以比最近涉及复杂架构选择和元学习的方法产生实质性的改进。我们进一步将原型网络扩展到零样本学习,并在CU-Birds数据集上实现目前最好的结果。

2.主要思想

(1)Our approach, prototypical networks, is based on the idea that there exists an embedding in which points cluster around a single prototype representation for each class. In order to do this, we learn a non-linear mapping of the input into an embedding space using a neural network and take a class’s prototype to be the mean of its support set in the embedding space. Classification is then performed for an embedded query point by simply finding the nearest class prototype. We follow the same approach to tackle zero-shot learning; here each class comes with meta-data giving a high-level description of the class rather than a small number of labeled examples. We therefore learn an embedding of the meta-data into a shared space to serve as the prototype for each class.

我们的方法,原型网络,是基于这样一个想法,即存在一个嵌入,其中点围绕着每个类的单个原型表示进行聚类。为了做到这一点,我们使用神经网络学习了一个输入到嵌入空间的非线性映射,并将类的原型作为其在嵌入空间中支持集的平均值。然后,通过简单地查找最近的类原型,对嵌入的查询点进行分类。我们采用相同的方法来处理零样本学习;在这里,每个类都有元数据,提供对类的高级描述,而不是少量带标签的示例。因此,我们学习将元数据嵌入到共享空间中,作为每个类的原型.

(2)In particular, we relate prototypical networks to clustering in order to justify the use of class means as prototypes when distances are computed with a Bregman divergence,such as squared Euclidean distance. We find empirically that the choice of distance is vital, as Euclidean distance greatly outperforms the more commonly used cosine similarity.
特别是,我们将原型网络与聚类联系起来,以证明当使用Bregman散度(如平方欧几里得距离)计算距离时,将类方法用作原型是合理的。我们从经验上发现,距离的选择是至关重要的,因为欧几里得距离大大优于更常用的余弦相似性。

(3)通过神经网络学会一个“好的”映射,将各个样本投影到同一空间中,对于每种类型的样本提取他们的中心点(mean)作为原型(prototype)。使用欧几里得距离作为距离度量,训练使得测试样本到自己类别原型的距离越近越好,到其他类别原型的距离越远越好。测试时,通过对到每类原型的距离做sofmax获得测试样本类别。 (参考)

3.方法

简述一下几个训练过程:
(1)在所有的类别中随机选择K个类别的样本
(2)在K个类别的样本中,随机选择出每个类别的support set和query set,各M个
(3)通过CNN网络进行特征映射,并计算每个类的样本的特征向量平均值作为类原型,下图c(k)就是类原型。
(4)计算quert set 的特征向量与K个类原型的距离,并通过softmax归一化,得到quert set 所属类别的概率分布。

4. 总结

本文提出的的Prototypical Networks(P-net)思想与match network(M-net)十分相似,但也有几个不同点:1.使用了不同的距离度量方式,M-net中是cosine度量距离,P-net中使用的是属于布雷格曼散度(详见论文)的欧几里得距离。2.二者在few-shot的场景下不同,在one-shot时等价(one-shot时取得的原型就是支持集中的样本)3.网络结构上,P-net相比M-net将编码层和分类层合一,参数更少,训练更加方便。

5. 补充

关于论文中Bregman divergence的理解,可参考知乎上一个大佬的回答:如何理解Bregman divergence? - 覃含章的回答 - 知乎
https://www.zhihu.com/question/22426561/answer/209945856
联系论文简单地说,就是Bregman divergence,就是如果你抽象地定义一种在特定空间里两个点之间的“距离”,然后在这些点满足任意的概率分布的情况下,这些点的平均值点(mean point)一定是空间中距离这些点的平均距离最小的点。所以后面作者在提取“原型”的时候,才能够直接使用均值点(mean point),所以感觉作者用欧几里得距离而不用余弦距离就是这个原因吧。

参考资料

[1] Prototypical Networks for Few-shot Learning论文下载
[2] 【领域报告】小样本学习年度进展|VALSE2018
[3] 当小样本遇上机器学习 fewshot learning
[4] 小样本学习(Few-shot Learning)综述
[5] 小样本学习(few-shot learning)之——原形网络(Prototypical Networks)不错

代码

[1] # jakesnell/prototypical-networks

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 220,137评论 6 511
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 93,824评论 3 396
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 166,465评论 0 357
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 59,131评论 1 295
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 68,140评论 6 397
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,895评论 1 308
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,535评论 3 420
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,435评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,952评论 1 319
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 38,081评论 3 340
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 40,210评论 1 352
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,896评论 5 347
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,552评论 3 331
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 32,089评论 0 23
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,198评论 1 272
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,531评论 3 375
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 45,209评论 2 357

推荐阅读更多精彩内容