登录注册写文章

深度学习激活函数Sigmoid、Tanh、ReLU和Softmax的区别

深度学习激活函数Sigmoid、Tanh、ReLU和Softmax的区别

深度学习中，需要设置门限值激活神经元。神经元的激活状态有两种：1. 激活，2.不激活。

我们如何设置门限值呢？

如果采用固定值，低于某个值则不激活，高于某个值激活，这时的函数图像类似直角脉冲，

直角脉冲

最像直角脉冲的激活函数为Sigmoid,

Sigmoid

Sigmoid的公式

它的优点是值域在0，1之间，可反应输入x的变化。

缺点也比较明显，如果处于上方或下方的平坦区域，梯度很小，导致梯度和权重的乘积小于1，多层之后，值会越来越少，出现梯度消失问题（vanishing gradient problem). 如果一直处于剧烈变化的区域，导致梯度和权重的乘积大于1，则多层之后，值会越来越大，出现梯度爆炸问题（exploding gradient problem）。

Tanh和Sigmoid的值域图像非常像，相当于Sigmoid的线性变换，但是值域扩大了，在[-1,+1]之间，具体的图像和公式如下：

Tanh函数图像

Tanh公式

Relu函数

Relu函数很简单，它的公式为：

Relu的公式

（想出这种函数有用的人是不是运气超好？？）

Relu的函数图像为：

Relu图像

Relu把负值归为0，计算起来很简单。但会有一个问题？

输出为0的神经元无法在网络中发挥作用，相当于死掉了（dying ReLU)，也不能激活。

如果网络中20%的神经元在训练中死亡，影响还是蛮大的。为了避免这种问题，人们提出了参数化的Relu，即Leaky ReLU 和 Parametric ReLU (PReLU) 激活函数，具体的公式和图像如下：

ReLU

ReLU的图像

最后我们来看看Softmax函数。

Softmax的值域在0,1之间，与sigmoid函数类似。Softmax的特点是用某个输出除以所有输出，其公式为：

softmax公式

这个公式所有的输出加起来正好等于1，相当于离散的概率分布函数，所以比较适合用来做分类。

最后编辑于：2021.02.24 14:17:47

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成，浏览时请结合常识与多方信息审慎甄别。
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

相关阅读更多精彩内容

激活函数、正向传播、反向传播及softmax分类器，一篇就够了！
1. 深度学习有哪些应用图像：图像识别、物体识别、图片美化、图片修复、目标检测。自然语言处理：机器创作、个性化...
mantch阅读 5,829评论 0赞 14
吴恩达深度学习(18)-神经网络激活函数讲解
激活函数（Activation functions）使用一个神经网络时，需要决定使用哪种激活函数用隐藏层上，哪种...
极客Array阅读 5,734评论 0赞 4

3. 深度学习- 常用的激活函数
在学习神经网络中,我们会常常碰到激活函数这个名词。那么什么是激活函数？激活函数激活的是什么？在神经网络中，有什么用...
李涛AT北京阅读 8,287评论 0赞 1
吾爱NLP(2)--解析深度学习中的激活函数
0、从深度学习开始说起今天检索多标签分本分类的文献时，遇到一个关于激活函数的疑惑：如果有大牛看到，知道如何更好...
流川枫AI阅读 8,819评论 2赞 17
深度学习激活函数的比较和优缺点，sigmoid，tanh，relu
1. 什么是激活函数如下图，在神经元中，输入的 inputs 通过加权，求和后，还被作用了一个函数，这个函数就是...
三不小青年阅读 12,567评论 1赞 1

友情链接更多精彩内容

赞1赞

赞赏

手机看全文