GAN是一种特殊的损失函数？

摘要：从本质上来说，生成对抗网络（GAN）是一种特殊的损失函数，我们来深入探索下这句话的含义。

数据科学家Jeremy Howard在fast.ai的《生成对抗网络（GAN）》课程中曾经讲过这样一句话：

“从本质上来说，生成对抗网络（GAN）是一种特殊的损失函数。”

你是否能够理解这句话的意思？读完本文，你会更好的理解这句话的含义。

神经网络的函数逼近理论

在数学中，我们可以将函数看做一个“机器”或“黑匣子”，我们为这个“机器”或“黑匣子”提供了一个或多个数字作为输入，则会输出一个或多个数字，如下图所示：

将函数可以比喻成一个“机器”或“黑匣子”

一般来说，我们可以用一个数学表达式来表示我们想要的函数。但是，在一些特殊的情况下，我们就没办法将函数写成一堆加法和乘法的明确组合，比如：我们希望拥有这样一个函数，即能够判断输入图像的类别是猫还是狗。

如果不能用明确的用数学表达式来表达这个函数，那么，我们可以用某种方法近似表示吗？

这个近似方法就是神经网络。通用近似定理表明，如果一个前馈神经网络具有线性输出层和至少一层隐藏层，只要给予网络足够数量的神经元，便可以表示任何一个函数。

具有4个隐藏单元的简单神经网络逼近函数

作为损失函数的神经网络

现在，我们希望设计一个猫和狗的分类器。但我们没办法设计一个特别明确的分类函数，所以我们另辟蹊径，构建一个神经网络，然后一步一步逐渐实现这一目标。

为了更好的逼近，神经网络需要知道距离目标到底还有多远。我们使用损失函数表示误差。

现在，存在很多种类型的损失函数，使用哪种损失函数则取决于手头上的任务。并且，他们有一个共同的属性，即这些损失函数必须能够用精确的数学表达式来表示，如：

1.L1损失函数（绝对误差）：用于回归任务。

2.L2损失函数（均方误差）：和L1损失函数类似，但对异常值更加敏感。

3.交叉熵损失函数：通常用于分类任务。

4.Dice系数损失函数：用于分割任务。

5.相对熵：又称KL散度，用于测量两个分布之间的差异。

在构建一个性能良好的神经网络时，损失函数非常有用。正确深入的理解损失函数，并适时使用损失函数实现目标，是开发人员必备的技能之一。

如何设计一个好的损失函数，也是一个异常活跃的研究领域。比如：《密度对象检测的焦点损失函数（Focal Loss）》中就设计了一种新的损失函数，称为焦点损失函数，可以处理人脸检测模型中的差异。

可明确表示损失函数的一些限制

上文提到的损失函数适用于分类、回归、分割等任务，但是如果模型的输出具有多模态分布，这些损失函数就派不上用场了。比如，对黑白图像进行着色处理。

如上图所示：

1.输入图像是个黑白鸟类图像，真实图像的颜色是蓝色。

2.使用L2损失函数计算模型输出的彩色图像和蓝色真实图像之间的差异。

3.接下来，我们有一张非常类似的黑白鸟类图像，其真实图像的颜色是红色。

4.L2损失函数现在尝试着将模型输出的颜色和红色的差异最小化。

5.根据L2损失函数的反馈，模型学习到：对于类似的鸟类，其输出可以接近红色，也可以接近蓝色，那么，到底应该怎么做呢？

6.最后，模型输出鸟类的颜色为黄色，这就是处于红色和蓝色中间的颜色，并且是差异最小化的安全选择，即便是模型以前从未见过黄色的鸟，它也会这样做。

7.但是，自然界中没有黄色的鸟类，所以模型的输出并不真实。

使用MSE预测的下一帧图像非常模糊

在很多情况下，这种平均效果并不理想。举个例子来说，如果需要模型预测视频中下一个帧图像，下一个帧有很多种可能，你肯定希望模型输出其中一种可能，然如果使用L1或L2损失函数，模型会将所有可能性平均化，输出一个特别模型的平均图像，这就和我们的目标相悖。

生成对抗网络——一种新的损失函数

如果我们没办法用明确的数学表达式来表示这个损失函数，那么，我们就可以使用神经网络进行逼近，比如，函数接收一组数字，并输出狗的真实图像。

神经网络需要使用损失函数来反馈当前结果如何，但是并没有哪个损失函数可以很好的实现这一目标。

会不会有这样一种方法？能够直接逼近神经网络的损失函数，但是我们没必要知道其数学表达式是什么，这就像一个“机器”或“黑匣子”，就跟神经网络一样。也就是说，如果使用一个神经网络模型替换这个损失函数，这样可以吗？

对，这就是生成对抗网络（GAN）。

Vanilla-GAN架构

Alpha-GAN架构

我们来看上面两个图，就可以更好的理解损失函数。在上图中，白色框表示输入，粉色和绿色框表示我们要构建的神经网络，蓝色表示损失函数。

在vanilla GAN中，只有一个损失函数，即判别器D，这本身就是一个特殊的神经网络。

而在Alpha-GAN中，有3个损失函数，即输入数据的判别器D，编码潜在变量的潜在判别器C和传统的像素级L1损失函数。其中，D和C不是明确的损失函数，而是一种逼近，即一个神经网络。

梯度

如果使用损失函数训练生成网络（和Alpha-GAN网络中的编码器），那么，应该使用哪种损失函数来训练判别器呢？

判别器的任务是区分实际数据分布和生成数据分布，使用监督的方式训练判别器比较容易，如二元交叉熵。由于判别器是生成器的损失韩式，这就意味着，判别器的二进制交叉熵损失函数产生的梯度也可以用来更新生成器。

结论

考虑到神经网络可以代替传统的损失函数，生成对抗网络就实现了这一目标。两个网络之间的相互作用，可以让神经网络执行一些以前无法实现的任务，比如生成逼真的图像等任务。

本文作者：【方向】

作者：阿里云云栖社区

链接：https://www.jianshu.com/p/34c99a50ce7d

來源：简书

简书著作权归作者所有，任何形式的转载都请联系作者获得授权并注明出处。

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 215,794评论 6赞 498
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 92,050评论 3赞 391
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 161,587评论 0赞 351
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 57,861评论 1赞 290
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 66,901评论 6赞 388
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 50,898评论 1赞 295
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 39,832评论 3赞 416
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 38,617评论 0赞 271
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 45,077评论 1赞 308
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 37,349评论 2赞 331
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 39,483评论 1赞 345
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 35,199评论 5赞 341
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 40,824评论 3赞 325
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 31,442评论 0赞 21
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 32,632评论 1赞 268
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 47,474评论 2赞 368
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 44,393评论 2赞 352

GAN是一种特殊的损失函数？

推荐阅读更多精彩内容