登录注册写文章

神经网络和深度学习 - Chapter3 浅层神经网络

神经网络和深度学习 - Chapter3 浅层神经网络

什么是神经网络？

下面这个浅层神经网络，由多个Logistic Regression堆叠而成；浅层神经网络的反向传播过程，和逻辑回归类似；
其中， $z^{[1]}$ 表示第一层神经网络的z值；上表 $[1]$ 表示第1层神经网络；

image.png

神经网络表示

一个简单的三层神经网络结构如下所示；
其中第一个隐藏层激活值： $a^{[1]} = \left[a^{[1]}_1, a^{[1]}_2, a^{[1]}_3, a^{[1]}_4 \right]^T$

image.png
每一个神经网络的激活值计算；
$z^{[1]}_1 = w^{[1]T}_1 x + b^{[1]}_1$ ，其中 $w^{[1]}_1 \in (3, 1), x \in (3, 1)$

image.png
浅层神经网络前向传播向量化表示；
$z^{[1]} = W^{[1]}x + b^{[1]}; a^{[1]} = \sigma(z^{[1]})$

image.png

image.png

多个样本浅层网络向量化

将 $m$ 个样本结果堆叠在一起： $z^{[1]} = \left[ z^{[1](1)}, z^{[1](2)}, ...,z^{[1](m)} \right]$ , 其中每一个结果 $z^{[1](i)}$ 都是一个列向量；

image.png

多个样本浅层网络向量化公式如下： $Z^{[1]} = W^{[1]}X + b^{[1]}$ ，其中 $W^{[1]} \in (h_1, n_x), X \in (n_x, m), b^{[1]} \in (h_1, 1)$
$Z^{[2]} = W^{[2]}A^{[1]} + b^{[2]}$ ，其中 $W^{[2]} \in (h_2, h_1), A^{[1]} \in (h_1, m), b^{[2]} \in (h_2, 1)$

多个样本浅层网络向量化表达.png

神经网络激活函数

常用的激活函数有：sigmoid，tanh，relu，leaky relu；
sigmoid一般在二分类的输出层使用，其他情况一般使用relu，或者tanh激活函数；
leaky relu主要是弥补，relu激活函数在x取值为负数的时候导数为0；

常见激活函数.png

神经网络为什么需要非线性激活函数？

隐藏层使用线性激活函数，无论堆叠多少层只能建模输入输出的线性关系；

线性激活函数.png

激活函数的导数

sigmoid激活函数导数： $g'(z) = g(z) \left[1- g(z)\right]$ ；
tanh激活函数导数： $g'(z) = 1 - \left[ g(z) \right]^2$ ；

sigmoid激活函数导数.png

tanh激活函数导数.png

relu和Leaky relu激活函数导数.png

浅层神经网络梯度求导

三层神经网络，参数求导过程如下：

image.png

三层神经网络前向&反向传播过程.png

神经网络参数初始化

为什么不要把网络参数都初始化为0 ？ 因为参数 $W$ 的行与行之间是一样的，导致同一隐藏层的结点激活值是一样的。这样每次神经同一层神经网络结点学到的是同样的函数，即是对称的；这样堆叠多个神经元没有任何意义。
解决方法是随机初始化网络参数，但是网络参数值不宜太大。因为对于sigmoid, tanh等这类激活函数，在取值很大的时候其导数接近于0，容易出现梯度消失问题；

神经网络参数初始化为0的弊端.png

随机初始化网络参数.png

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成，浏览时请结合常识与多方信息审慎甄别。
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

相关阅读更多精彩内容

吴恩达深度学习-神经网络基础（浅层神经网络）
第三周浅层神经网络： 3.1 神经网络概览3.2 神经网络表示 loss function L(a，y)...
瘦长的丰一禾阅读 862评论 0赞 2
神经网络和深度学习WU Week3——浅层神经网络
1. 符号约定 []，中括号表示与层相关，如[1]表示第一层，以此类推，输入层表示为[0]层，一个神经网络的层数不...
xiaobaoma阅读 600评论 0赞 1

神经网络和深度学习
一、深度学习概论 1.1 什么是神经网络神经元代表了线性修正单元函数 1.2用神经网络进行深度学习监督学习：已...
WellLin阅读 531评论 0赞 0
神经网络和深度学习
深度学习概论神经网络属于监督学习，并彻底改变了监督学习。神经网络这个概念不是近几年才有，但是却是近几年兴起的。那...
Koreyoshier阅读 796评论 0赞 0
吴恩达-神经网络和深度学习（第三周浅层神经网络：）
未经允许，不得擅自改动和转载学习使用前向传播和反向传播搭建出有一个隐藏层的神经网络。 hidden layer ...
双愚阅读 1,190评论 0赞 3

友情链接更多精彩内容

赞1赞

赞赏

手机看全文