AI数学基础11——为什么人工神经网络需要非线性激活函数?

每一个神经元里面都有一个激活函数,如下图所示:


那么为什么人工神经网络需要激活函数尤其是非线性激活函数呢?

我们用人工神经网络来表述输入X与输出Y之间复杂的关系,用数学语言来说,就是用人工神经网络来实现复杂的函数;使用线性激活函数,神经网络只是把输入线性组合再输出,所以无法实现对复杂函数的逼近。

非线性激活函数可以使神经网络随意逼近复杂函数,类似非线性的Sine函数随意逼近各种复杂函数一样。

没有激活函数带来的非线性,多层神经网络和单层无异。非线性激活函数对深层神经网络的函数逼近能力起着至关重要的作用

另外:激活函数对于将神经网络的输出压缩进特定边界内也非常关键。神经元


的输出值可以非常大。该输出在未经修改的情况下馈送至下一层神经元时,可以被转换成更大的值,这样过程就需要极大算力。激活函数的一个任务就是将神经元的输出映射到有界的区域(如,0 到 1 之间)。

由此,不能在隐藏层用线性激活函数

总结一下人工神经网络需要非线性激活函数的原因:

1,逼近复杂函数;

2,将神经元的输出压缩进特定边界。

参考文献:《Understanding Activation Functions in Deep Learning

对于深度学习来说,深层神经网络使用反向传播法(Back propagation)进行训练,反向传播法使用梯度下降法更新权重,梯度下降法要求激活函数可微分


从另外的一个角度理解:神经网络的功能,就是用一组基函数的组合去逼近一个目标函数,实际上和泰勒级数,傅立叶级数,小波变换的思想是一样的。以一个二维曲线为例,如果没有非线性的激活函数,那么实际上就是一组直线矢量相加,我们知道再多的直线加起来还是一条直线,所以必须要用非线性的基相加。从泰勒级数可以知道,任何函数可以分解为x的幂级数,而一个非线性函数,比如sin,cos,又或者sigmoid,都可以分解为x的无穷次幂级数。根据线性方程理论,取n个基,比如sin(nx)和cos(nx),就可以逼近目标函数的泰勒分解的前n项,那么如果取的项够多,就可以通过一个组合来逼近目标函数的泰勒分解的前任意项。

理论是这样,但实际中各种基的效果是不一样的,如果用泰勒分解的话,我们知道在接近0点的时候效果好,离0点越远误差越大,由于x的n次幂在x越大时,值发散的越快,更主要的是它的定义域是无限的,所以需要用大量的小系数高次项来给低次项擦屁股,所以这种全域作用,且越远影响越大的基效果很不好。

在工程上用的更多的是分段低次拟合的方法,效果比全域高次拟合要好的多,小波变换,样条差值等等都是这种思想,实际上神经网络的激活函数也是这样,sigmoid可以认为就是一个定义域有限的非线性函数,虽然它名义上定义域是无限的,但实际上超过一定范围后值就不变了,可以用一个阶跃函数充分抵消其在不期望的范围外的影响。但是sigmoid的问题在于,第一,其影响的范围还是比较长(衰减缓慢),第二,它的形状是个s形,且对称,很多时候目标函数就是个凸的,你来个大S总有一半对不齐,第三,也是我觉得最重要的,我需要一个干脆的阶跃来截断范围外的影响,但是sigmoid提供不了。

在工程上分段低次拟合用得最多的是几次?实际上是最简单的一次线段!有限元分析里面就是大量的直线,三角形,计算简单,只要分段够多精度也不错。Relu实现的就是分段一次拟合,仔细看就可以发现其实一对Relu就可以确定一条线段。还是以二维曲线逼近为例,可以从最左端开始在每个分段点用一个带系数的relu来完成一系列折线从而逼近目标函数。因此Relu比sigmoid方便的多。

因此从分段逼近的角度来考虑,relu是纯直线线段,其它的一些类relu是带点曲线的,而且不像Sigmoid一样有个画蛇添足的大S,真的需要S形时完全可以用两个凸曲线去拼。

至于其它的0均值,1方差之类的属于锦上添花,减少训练偏置参数的时间。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 222,183评论 6 516
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 94,850评论 3 399
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 168,766评论 0 361
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 59,854评论 1 299
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 68,871评论 6 398
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 52,457评论 1 311
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,999评论 3 422
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,914评论 0 277
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 46,465评论 1 319
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 38,543评论 3 342
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 40,675评论 1 353
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 36,354评论 5 351
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 42,029评论 3 335
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 32,514评论 0 25
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,616评论 1 274
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 49,091评论 3 378
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 45,685评论 2 360

推荐阅读更多精彩内容

  • 文章主要分为:一、人工神经网络的概念;二、人工神经网络的发展历史;三、人工神经网络的特点;四、人工神经网络的结构。...
    艾剪疏阅读 16,355评论 0 7
  • ●沙鸿 2017年12月25日 如何面对过错,其实是个很古老的话题。古人云,人非圣贤,孰能无过?阳明先生说...
    五月楚久阅读 324评论 0 0
  • 1 每当阳光柔软的像天鹅绒 总想叫你一起躺上去 一寸好的光阴也要掰半寸给你 2 我的手掌最好比你的大一些 冬天牵手...
    野马王阅读 731评论 16 13
  • 序: 一直想写篇文章,关于青梅,却因为这样那样的原因不能提笔,或是提笔三两句后,便没了意绪,如此也是了了一桩心愿。...
    梅开还我一半心阅读 287评论 0 0
  • 抬眼望却尽头,你似乎是向我走来了。背着光源径直走近让我感到身体发软,背上汗津津的,也只好勉强支撑,任凭这带着光晕的...
    十町阅读 506评论 1 10