告别死记硬背，元学习才能学会学习

姓名：李妙歌学号：20021210904

转载自https://mp.weixin.qq.com/s/7aI2pX3TFT7teY_2I5mjqQ

【嵌牛导读】：本文介绍的是 ICLR 2020 spotlight 论文《Meta-Learning without Memorization》(无记忆的元学习)，来自德克萨斯大学奥斯汀分校在读博士生殷明章。

【嵌牛鼻子】：元学习记忆问题元正则化方法

【嵌牛提问】：如何提出、定义、分析元学习中的记忆问题？如何让元学习更好的学会学习？

【嵌牛正文】：

让我们回顾片刻在学校学习的经历。每一天我们去上课，回答老师的问题；回家后我们解答作业问题，对照答案检查正确与否。日积月累，我们不仅学到了知识，更学会了如何学习 (learning to learn)。当面对新任务时，我们可以利用之前解决问题的经验并加上少量的练习，迅速学会新的技能。这种 “快速适应 (fast adaptation)” 能力被认为是智能的重要体现。在人工智能领域，元学习 (meta-learning) 是一种使机器 “学会学习” 的有效手段。

在这篇论文里，我们发现一个表征能力强大的人工神经网络除了 “快速适应” 外，还可以通过 “记忆” 的方式来解决训练集里的多项任务。不幸的是，一个只会记忆的神经网络不具备解决新任务的能力这篇论文旨在提出、定义、分析元学习中的记忆问题，并提出新的元正则化方法 (meta-regularization) 以避免记忆问题。

1 元学习的图模型

要训练一个元学习模型，首先需要从一个任务分布 $p(\tau )$ 中生成多个任务。每个任务都由一个带标注的任务内训练数据 $D=(X,Y)$ 和测试数据 $D^*=(X^*,Y^*)$ 组成。我们用 $M$ 代表所有用于元训练（meta-training）的数据， $\tau _{j}$ 代表一个元测试阶段的新任务。

我们在 $M$ 上训练模型, 目标是当面对新任务时，它能够在少量训练数据 $D_{j}$ 上实现快速适应，从而准确预测新任务测试数据 $X_{j}^*$ 的标签。这个过程可以表示为一个层次型的图模型：

2 记忆问题

回到开头的例子，假设在学校每天学习的内容是解决一种题型，这对应于元训练里的一个任务。经过一段时间后，假设每种题型都被重复学习了若干次。如果一个学生可以记住各个题型，那么她/他将不需要再去上课也可以解决作业里的问题。也就是说她/他可以解决已知题型里的新问题，但这样的纯粹记忆并不能解决新的题型。让我们再看一个例子，假设每一个元训练里的任务是拟合一些线性相关的数据。我们希望模型能够学会利用少量的数据去估计模型参数，如下图所示：

这种快速适应能力可以泛化到解决元测试中的未曾见过的新任务，如下图（左）。但我们发现，如果模型足够灵活，那么一个单一模型就可以解决元训练中的所有任务，并且忽略任何任务内训练数据，如下图(右)。这导致在元测试阶段，当面对一个新任务时，算法仍然会忽略任务内训练数据，但这样做将无法解决新任务

我们将这样的现象定义为元学习中的记忆问题 (memorization problem)，数学上表述为条件互信息为零：

$I(\hat{y} ^*;D|x^*,M)=0$

也就是说预测值和任务内训练数据是条件独立的。

值得注意的是记忆问题是否会出现与任务分布 $p(\tau )$ 紧密相关。我们发现，如果各任务是互斥的（mutually exclusive），意即一个单一预测模型不可以解决所有的任务，那么记忆问题不会出现。例如小样本分类（few-shot classification）广泛地利用了这个特性。但在很大一类问题中，各任务不互斥，因此记忆问题广泛存在，并会影响多种元学习算法。

3 元正则化

基于以上分析和图表式，我们发现用于预测模型的信息来自元训练数据 $M$ , 任务内训练数据 $D$ 和输入 $x^*$ 。因此如果能够控制来自 $M$ 和 $x^*$ 的信息，同时要求实现精确预测，就可以鼓励模型利用 $D$ 中的信息而不是忽略它。利用信息不等式和PAC-Bayes理论，我们得出一种方式是利用信息瓶颈（information bottleneck）约束：

$D_{KL}(q(z^*|x^*,\theta )||r(z^*))$

另一种方式是约束

$D_{KL}(q(\theta |M)||r(\theta ))$

其中 $\theta$ 对应编码器 (encoder): $x\rightarrow z$ 的参数。将以上元正则项 (Meta Regularization)和Model Agnostic Meta-Learning (MAML)，Conditional Neural Process (CNP) 相结合，我们提出了新的 “MAML先生” (MR MAML) 和 “CNP先生” (MR CNP) 算法。在几个非互斥任务的数据集上，我们的算法实现了大幅度的性能提升。在一个3D物体方向预测数据集上我们进行了实验：

我们也在非互斥的少样本分类数据上进行了实验：

4 结论

（1）记忆问题广泛存在于元学习问题和元学习算法中

（2）记忆问题是一种任务层面的过拟合，这不同于传统上数据点层面的过拟合

（3）通过元正则方法我们有效地控制了记忆问题，并拓展了元学习的应用场景

论文地址:

1.https://openreview.net/pdf?id=BklEFpEYwS

2.https://www.aminer.cn/pub/5e718f6c9e795e1c35c5f81f/meta-learning-without-memorization

代码地址: https://github.com/google-research/google-research/tree/master/meta_learning_without_memorization

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 216,125评论 6赞 498
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 92,293评论 3赞 392
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 162,054评论 0赞 351
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 58,077评论 1赞 291
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 67,096评论 6赞 388
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 51,062评论 1赞 295
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 39,988评论 3赞 417
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 38,817评论 0赞 273
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 45,266评论 1赞 310
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 37,486评论 2赞 331
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 39,646评论 1赞 347
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 35,375评论 5赞 342
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 40,974评论 3赞 325
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 31,621评论 0赞 21
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 32,796评论 1赞 268
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 47,642评论 2赞 368
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 44,538评论 2赞 352

告别死记硬背，元学习才能学会学习

1 元学习的图模型

2 记忆问题

3 元正则化

4 结论

推荐阅读更多精彩内容