Generative Adversarial Networks(Section 0&1)

本报告总结了 NIPS 上 Ian Goodfellow 的 生成式对抗网络课程。其内容有:(1)为何生成式建模是值得学习的话题;(2)生成式模型如何工作,GAN 与其他生成式模型的比较;(3)GAN 工作原理;(4)GAN 的研究前沿;(5)将 GAN 和其他方法组合的当前最优的图像模型。最后给出帮助读者学习的三个练习和相应的解答。

引言

本报告总结了 NIPS2016 上的生成对抗网络的课程。回答了很多之前的听众提出来的大多数问题,并尽可能地确保它对大家有用。当然,它不能算是 GAN 这个领域的完整的回顾;很多优秀的论文并没有得到展示,因为这些论文并不是针对大家提出来的这些问题的,而本课程是作为一个两个小时的演讲,所以也没有足够的时间来涉及所有话题。

本报告给出了:(1)为何生成式建模是一个值得研究的领域;(2)生成式模型如何工作,GAN 与其他的生成模型的对比(3)GAN 工作的细节(4)GAN 研究前沿和(5)组合 GAN 和其他方法得到了当前最优的图像模型。最后这个报告会包含三个练习及其解答。

而本课程的相关演示文档也可以获得,有 pdf 和 keynote 两种格式:http://www.iangoodfellow.com/slides/2016-12-04-NIPS.pdfhttp://www.iangoodfellow.com/slides/2016-12-04-NIPS.key

图 1
图 2

课程视频是由 NIPS 录制的,过段时间应该能够看到。

生成式对抗网络是生成式模型的一种。“生成式模型”这个词有很多用法。本课程中,它表示任何一种可以接受训练集(从一个分布 pdata 采样的样本)学会表示该分布的估计的模型。其结果是一个概率分布 pmodel。有些时候,模型会显式地估计 pmodel,比如说图1所示。还有些时候,模型只能从 pmodel 中生成样本,比如说图2。有些模型能够同时这两件事情。虽说 GANs 经过设计可以做到这两点,我们这里把精力放在 GANs 样本生成上。

1 为何学习生成式建模?

大家有理由会想知道为何生成式模型值得学习,特别是那些只能够生成数据而不是能对密度函数进行估计的生成式模型。总而言之,当我们把它用在图像上是,这样的模型仅仅能够给出更多的图像,我们其实并不缺少图像啊。

下面给出几个学习和研究生成式模型的理由:

  • 训练生成式模型和从生成式模型进行采样是我们表示和操纵高维概率分布的能力的特别好的检验。高维概率分布在很多的应用数学和工程领域都是举足轻重的研究对象。
  • 生成式模型可以被以多种方式用在强化学习中。强化学习算法常常会被分类成两类:基于模型和免模型的,而基于模型的算法就是包含生成式模型的。时间序列数据的生成式模型可以被用来模型可能的未来。这样的模型可以被用来进行规划和多种方式的强化学习任务。用于规划的生成式模型可以学到在给定世界当前的状态和假设智能体会采取的行动作为输入时,关于世界的未来状态的条件分布。而智能体可以用不同的潜在行动来查询这个模型,选择模型预测为最可能从此行动得到想要的状态的行动。最近出来的这种模型例子是,Finn 等人的研究工作,而对把这个模型用于规划的例子就是 Finn 和 Levine 的研究工作。另一种生成式模型可以被用在强化学习上的方式是在一个想象的环境中进行学习,其中错误的行动不会给智能体带来真实的损失。生成式模型还可以通过追踪不同状态被访问的频率或者不同的行动被尝试的频率来指导探索,特别是 GANs,可以用在逆强化学习中,在第 5.6 节我们会讲其与强化学习的关联。
  • 生成式模型可以用 missing 数据进行训练,并能够给出输入数据的 missing 部分。而 missing 数据的特别有趣的例子就是半监督学习(semi-supervised learning),其中很多(或者几乎所有)训练样本的标签都是丢失的。现代深度学习算法一般是要求有特别多的带标签样本才能够泛化得很好。半监督学习是降低样本标签的策略。这个学习算法可以通过研究大量无标签样本提升自己的泛化性能,而这些无标签样本是很容易获得的。生成式模型尤其是 GANs,能够很好地执行半监督学习算法。这个会在第 5.4 节介绍。
图 3
  • 生成式模型尤其是 GANs,让机器学习能够更好地利用多模态输出。对很多任务,单个输入可能会对应不同的正确答案,这些答案中的每一个都是可以接受的。某些传统训练机器学习模型的方式,如最小化目标输出和模型预测输出的均方误差,并不能够训练出可以产生多个不同的正确答案的模型。这种场景的一个例子就是预测视频的下一帧,参见图 3。
  • 最后,很多任务本质上都是需要某个分布中的采样的样本的。

我们在下面列举一些此类任务的例子:

  • 单个图片超分辨率:这个任务的目标是以低分辨率图像为输入,合成高分辨率的相同内容的图片。生成式建模的作用就是让模型能够为图像加入原本就该属于输入的信息。有很多对应于低分辨图像的超分辨图像。这个模型应该选择一副采样自可能的图像的概率分布的图像。选择一幅是所有可能图像的平均图像可能会得到一个太过模糊的结果。参见图 4。
图 4
  • 一些创作艺术的任务。两个近期项目表明生成式模型,尤其是 GANs,可以用于创建交互式程序来帮助用户创作对应于他们想象的粗线条场景的更加真实的图像。参见图 5 和图 6.
图 5
图 6
  • 图像到图像的转换应用可以转换航摄照片成地图或者将线条转换为图像。有很多困难但是很有用的创造性的应用。参见图 7。
图 7

所有上面提到以及其他的生成式模型的应用都说明花时间和资源来提升生成式模型的性能是值得的。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 205,033评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 87,725评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 151,473评论 0 338
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,846评论 1 277
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,848评论 5 368
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,691评论 1 282
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,053评论 3 399
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,700评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 42,856评论 1 300
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,676评论 2 323
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,787评论 1 333
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,430评论 4 321
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,034评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,990评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,218评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,174评论 2 352
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,526评论 2 343

推荐阅读更多精彩内容