前向传播和反向传播

在求出前向传播和反向传播前要先确定参数和输入输出符号的表达形式

最普通的DNN就可以看做是一个多层感知机MLP,感知机的输出其实就是对输入的加权求和:z=\sum w_ix_i+b,再经过一个非线性激活函数\sigma(z)

首先来定义权值矩阵W,按照下图规则,w_{24}^3表示的是第3层第2个神经元和第2层第4个神经元之间连线(连线就代表权重,可以看成是w_{24}^{32}的省略写法)。那么为什么不写成w_{42}^3呢,形式上是允许的,但是如果这样写的话,第3层神经元的输入就要通过w^Tx+b来计算,而前者只需要计算wx+b,省略了矩阵转置的额外工作量。

偏置项b的定义也是类似,b_3^2表示第2层第3个神经元的偏置。

再定义a_j^i,z_j^i分别表示第i层第j个神经元的输出和输入,并假设\sigma(z)是我们选择的激活函数。

前向传播过程

三层DNN,输入层-隐藏层-输出层

对于第2层第1个节点的输出a_1^2有:a_1^2=\sigma(z_1^2) = \sigma(w_{11}^2x_1 + w_{12}^2x_2 + w_{13}^2x_3 + b_1^{2})

对于第3层第1个节点的输出a_1^3有:a_1^3=\sigma(z_1^3) = \sigma(w_{11}^3a_1^2 + w_{12}^3a_2^2 + w_{13}^3a_3^2 + b_1^{3})

一般化的,假设l-1层有m个神经元,对于a_j^l有:

a_j^l=\sigma(z_j^l)=\sigma(\sum_{k=1}^m w_{jk}^la_k^{l-1}+b_j^l)

也就是第l层第j个神经元的输入为与它相连的上一层每个神经元的输出加权求和后加上该神经元对应的偏置,该神经元所做的工作只是把这个结果做一个非线性激活。

反向传播过程

当通过前向传播得到由任意一组随机参数W和b计算出的网络预测结果后,我们可以利用损失函数相对于每个参数的梯度来对他们进行修正。事实上神经网络的训练就是这样一个不停的前向-反向传播的过程,直到网络的预测能力达到我们的预期。

假设选择最简单的均方误差和作为损失函数:J(W,b,x,y)=\frac {1}{2}||a^L-y||_2^2

下面就根据这个损失函数更新每一层的w,b

根据前向传播的公式,输出层L的输出a^L=\sigma(z^L)=\sigma(w^La^{L-1}+b^L)

带入到损失函数中,有J(W,b,x,y)=\frac {1}{2}||\sigma (w^La^{L-1}+b^L)-y||_2^2

根据复合函数链式求导法则,L层参数W^L,b^L的梯度容易求得:

\delta w^L=\frac{\partial J(W,b,x,y)}{\partial W^L}=\frac {\partial J(W,b,x,y)}{\partial z^L}\cdot \frac{\partial z^L}{\partial W^L}=(a^L-y)\odot \sigma^{(1)}(z^L)(a^{L-1})^T

\delta b^L=\frac{\partial J(W,b,x,y)}{\partial b^L} = \frac{\partial J(W,b,x,y)}{\partial z^L}\frac{\partial z^L}{\partial b^L} =(a^L-y)\odot \sigma^{(1)}(z^L)

显然,两式有一部分是重叠的,将这部分记做\delta^L\delta^L=\frac{\partial J(W,b,x,y)}{\partial b^L} =(a^L-y)\odot \sigma^{(1)}(z^L)

这一规律同样适用在非输出层的隐藏层L-1,L-2,...l,...1,我们只需要求出损失函数相对l层非激活输出z^l的导数,再根据前向传播公式z^l=w^la^{l-1}+b^l便可以轻易的求得W^L,b^l

同样,根据链式求导法则,

\delta^l =\frac{\partial J(W,b,x,y)}{\partial z^l} = \frac{\partial J(W,b,x,y)}{\partial z^L}\frac{\partial z^L}{\partial z^{L-1}}\frac{\partial z^{L-1}}{\partial z^{L-2}}...\frac{\partial z^{l+1}}{\partial z^{l}}

\frac{\partial J(W,b,x,y)}{\partial W^l} = \frac{\partial J(W,b,x,y)}{\partial z^l} \frac{\partial z^l}{\partial W^l} = \delta^{l}(a^{l-1})^T

至此,问题的关键转化成如何求解\delta^l,既然是反向传播,在求第l层参数时,\delta^L,...,\delta^{l+1}都是已知的,还是根据链式求导法则:

\delta^{l} = \frac{\partial J(W,b,x,y)}{\partial z^l} = \frac{\partial J(W,b,x,y)}{\partial z^{l+1}}\frac{\partial z^{l+1}}{\partial z^{l}} = \delta^{l+1}\frac{\partial z^{l+1}}{\partial z^{l}}

显然,问题的关键在于求解\frac{\partial z^{l+1}}{\partial z^{l}},再根据前向传播公式,

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 217,406评论 6 503
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,732评论 3 393
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 163,711评论 0 353
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,380评论 1 293
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,432评论 6 392
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,301评论 1 301
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,145评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,008评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,443评论 1 314
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,649评论 3 334
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,795评论 1 347
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,501评论 5 345
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,119评论 3 328
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,731评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,865评论 1 269
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,899评论 2 370
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,724评论 2 354

推荐阅读更多精彩内容

  • 人生都是在偷懒中度过的,人生又是在与偷懒的战斗中度过的。不想起床,不想看书,不想学习,不想长大,有很多不想。...
    永远的浩子阅读 112评论 0 2
  • 一、Jenkins安装 1.进入Jenkins的官网https://jenkins.io/index.html,然...
    jorgon阅读 666评论 0 0
  • 自是清明春意浓,花开万木绿葱茏。佳人有约乐融融。 楼下望穿车迤逦,街前立尽月朦胧。潇潇雨打老梧桐。 词林正韵/钦定...
    庆善阅读 584评论 18 14
  • 火车晚点,车站候车无聊。近来是压抑的因为各种原因,晚上时常会睡不着,每次深夜躺在床上听着舍友的鼠标滴答声心绪四处...
    东京那座咖啡馆阅读 272评论 1 0