Pytorch-激活函数

1、什么是激活函数

它来自动物界的灵感，动物的神经元会接受来自对它有作用的其他神经元的信号，当然这些信号对该神经元的作用大小不同（即具有不同的权重）。那么该神经元的信号值就是其他神经元信号加权求和后的值。如果该信号值大于指定阈值，则会激活，否则不会激活，抽象的数学模型为：

这里的激活函数就是阶跃函数，但在0处跃变且不可导。

进一步抽象出神经网络模型中神经元模型为：

其中 $f$ 为激活函数

2、神经网络中激活函数有什么用？

作用就是：增加模型非线性

2.1 没有激活函数世界会怎样？（可能简单的二分类问题都不能被优雅解决）

现在有一个二分类问题，将三角形和圆点进行正确分类，如图1所示。我们试着用神经网络解决这个问题。跟大家说明一下，这是一个线性不可分的问题（就是你在这个平面里，找不到一条直线可以把图中的三角形和圆点完全分开）。如果你能找到，算你厉害！

图1：二分类问题

可能的解决思路：
1）用单层感知机（不带激活函数）
首先我们想到利用最简单的单层感知机来解决，单层感知机可以画出一条直线，把平面分开，如图2所示。

图2：单层感知机分割平面

图2中，左图是没有激活函数的单层感知机结构，其中 $w_1，w_2$ 是权重值， $b$ 是偏置值，它的工作原理是：输入一个样本（有两个特征 $(x_1，x_2)$ ），如果 $y>0$ 说明该样本是正类；如果 $y<0$ ，说明该样本是负类。我们这里不讨论 $y=0$ 的特殊情况。根据单层感知机的工作原理，我们画出右边的坐标图。

结论是：不带激活函数的单层感知机是一个线性分类器，不能解决线性不可分的问题。 不能解决图1中的二分类问题。

2）用多个感知机（不带激活函数）

不带激活函数的单层感知机解决不了问题，那我们就会想到用多个感知机进行组合，获得更强的分类能力，看看能不能解决我们的线性不可分问题。如图3所示。

图3 多个感知器

图3中，虽说模型变得复杂，表达能力更强一点，但 $y$ 还是一个关于 $x_1$ 和 $x_2$ 的线性表达式.

结论是：合并后的多个感知器本质上还是一个线性分类器，还是解决不了非线性的问题。

进一步分析总结：
不管是单层感知机还是多个感知器，只要不带激活函数，都只能解决线性可分的问题，解决不了我们的线性不可分问题。不信，那我们就在平面中画几条直线试试，结果发现这几条直线无论在平面中如何旋转，都不能完全正确的分开三角形和圆点。结果如图4所示。

图4：线性分类器解决不了问题

在上面的线性方程的组合过程中，我们其实类似的在做三条直线的线性组合，如图5所示。图5描述了，当我们直接用没有激活函数的分类器时，其实我们还是线性组合，最多也就是更复杂的线性组合罢了。有人在这里又要抖机灵了！我数学学的好，我记得学高等数学的时候，在不定积分那一块，有个画曲为直思想来近似求解。那么，我们可以来借鉴一下，用无数条直线去近似接近一条曲线，你很聪明啊！但是比着用非线性的激活函数来说，你这解决办法还是太低端了一些。

图5：没有激活函数的分类器

因此就需要来引入激活函数了。

2.2 激活函数怎么起作用？

我们再设计一个神经网络，在所有的隐层和输出层加一个激活函数，这里激活函数我们就用Sigmoid函数，如图6所示。这样 $y$ 输出的就是一个非线性函数了， $y$ 的输出更复杂，有了这样的非线性激活函数以后，神经网络的表达能力更加强大了。能不能解决我们一开始提出的线性不可分问题呢？我们接着来验证吧！

图6：带有非线性激活函数的感知机

我们把图6中的带有激活函数的单层感知机扩展到带有激活函数的多个神经元的情况。那么神经网络的表达能力更强，具体如图7所示。

图7：带有激活函数的多个神经元组成的神经网络

图8：带激活函数的非线性组合

和图7相对应的非线性组合是图8所示的样子。这样看起来，似乎已经能解决我们线性不可分的问题了。最后，我们通过最优化损失函数的做法，通过不断的学习，能够学到正确分类三角形和圆点的曲线。具体学到什么曲线，我们不知道，或许是图9所示的曲线，也可能是其他曲线。

图9：可能学习到的分类曲线

总结：激活函数是用来加入非线性因素的，提高神经网络对模型的表达能力，解决线性模型所不能解决的问题。要知道大部分问题是非线性问题，因此激活函数是必不可少的。

【待看】Hyper-parameters in Action! Part I — Activation Functions（可能需要翻墙）

3、常见的激活函数

26种神经网络激活函数可视化
 Visualising Activation Functions in Neural Networks（可能需要翻墙）

以三种常见的为例介绍，Sigmoid、tanh、Relu

3.1 Sigmoid

Sigmoid函数式：

$f(x)= \sigma(x)=\frac{1}{1+e^{-x}}$

Sigmoid函数图像：

Sigmoid

Sigmoid函数图像代码：

def sigmoid():
    x = np.arange(-10, 10, 0.1)
    y = 1 / (1+np.exp(-x))
    plt.plot(x, y)
    plt.grid()
    plt.show()

Sigmoid函数求导：

Sigmoid函数优点：

能够将函数压缩至区间[0, 1]之间，保证数据稳定，波动幅度小

Sigmoid函数缺点：

函数在两端的饱和区梯度趋近于0，当反向传播时容易出现梯度消失或梯度爆炸（不清楚为什么会梯度爆炸？）
输出不是0均值(zero-centered)，这样会导致，如果输入为正，那么导数总为正，反向传播总往正方向更新，如果输入为负，那么导数总为负，反向传播总往负方向更新，收敛速度缓慢
运算量较大

pytorch中Sigmoid函数的使用

3.2 tanh

tanh函数式:

$f(x)=tanh(x)=\frac{(e^{x}-e^{-x})}{(e^{x}+e^{-x})}=2 sigmoid(2x) - 1$

tanh函数图像：

tanh

tanh函数图像代码：

def tanh():
    x = np.arange(-10, 10, 0.1)
    y = (np.exp(x) - np.exp(-x)) / (np.exp(x) + np.exp(-x))
    plt.plot(x, y)
    plt.grid()
    plt.show()

tanh 函数求导：

tanh 函数优点：

解决了Sigmoid函数非0均值的问题，将函数压缩至区间[-1, 1]之间
pytorch中tanh函数的使用

tanh 函数缺点：

函数在两端的饱和区梯度趋近于0，当反向传播时容易出现梯度消失或梯度爆炸（不清楚为什么会梯度爆炸？）
运算量大

pytorch中tanh函数的使用

3.3 Relu

Relu函数式:

$f(x) = \left\{\begin{matrix} 0 & for \; x < 0\\ x & for \; x \geqslant 0 \end{matrix}\right.$

Relu函数图像：

Relu

Relu函数图像代码：

def relu():
    x = np.arange(-10, 10, 0.1)
    y = np.where(x<0, 0, x)
    plt.plot(x, y)
    plt.grid()
    plt.show()

Relu函数求导：

$f^{'}(x) = \left\{\begin{matrix} 0 & for \; x < 0\\ 1 & for \; x \geqslant 0 \end{matrix}\right.$

Relu优点：

梯度不饱和，收敛速度快
减轻反向传播时梯度弥散的问题
由于不需要进行指数运算，因此运算速度快、复杂度低

Relu缺点：

输出不是0均值(zero-centered)
对参数初始化和学习率非常敏感，设置不当容易造成神经元坏死现象，也就是有些神经元永远不会被激活(由于负部梯度永远为0造成)

pytorch中Relu函数的使用

参考文献

神经网络激励函数的作用是什么？有没有形象的解释？

最后编辑于：2020.02.05 16:55:54

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 216,470评论 6赞 501
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 92,393评论 3赞 392
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 162,577评论 0赞 353
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 58,176评论 1赞 292
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 67,189评论 6赞 388
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 51,155评论 1赞 299
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 40,041评论 3赞 418
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 38,903评论 0赞 274
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 45,319评论 1赞 310
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 37,539评论 2赞 332
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 39,703评论 1赞 348
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 35,417评论 5赞 343
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 41,013评论 3赞 325
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 31,664评论 0赞 22
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 32,818评论 1赞 269
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 47,711评论 2赞 368
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 44,601评论 2赞 353