登录注册写文章

神经网络CNN的前向传播和后向传播

神经网络CNN的前向传播和后向传播

这里也来总结一下卷积层的前向和后向传播。

前向传播

假设第 l 层是卷积层，卷积层前向的公式可表示如下：

$a^l = \sigma(Z^l) = \sigma(a^{l-1} * w^l + b^l )$

其中，上标 l 代表层数， $\sigma$ 代表激活函数，* 代表卷积运算， $w^l$ 是 l 层的卷积核， $b^l$ 是 l 层的偏置， $a^l$ 则是卷积层的输出， $a^{l-1}$ 是卷积层的输入。

假设卷积层输入的图像宽度和高度分别为： $W^{l-1} , H^{l-1}$ , 通道数为 $C^{l-1}$ , 则卷积层输入 $a^{l-1}$ 的维度为:

$W^{l-1} * H^{l-1} * C^{l-1}$

如果卷积核的大小表示为 : $f_w * f_h$ , 卷积核的个数表示为 K, 则卷积层的weight $w^l$ 的维度为：

$f_w * f_h * C^{l-1} * K$

假设卷积层输出的图像宽度和高度分别为： $W^l , H^l$ ，则卷积层的输出 $a^l$ 的维度为:

$W^l * H^l * K$

偏置 $b^l$ 是一维的向量，大小为K.

后向传播

如果l层是卷积层，已知卷积层的梯度 $\delta^l$ , 则前一层l-1层的梯度公式如下：

$\delta^{l-1} = \delta^l * rot180(w^l)$ ⊙ $\sigma'(Z^{l-1})$
其中， $\delta^l$ 的维度为： $W^l * H^l * K$ .
$\delta^{l-1}$ 的维度为： $W^{l-1} * H^{l-1} * C^{l-1}$ .

卷积层输入的偏导为：
$\partial a^{l-1} = \delta^l * rot180(w^l)$
$\partial a^{l-1}$ 的维度为： $W^{l-1} * H^{l-1} * C^{l-1}$ .

卷积层权重的偏导为：
$\partial w^l = a^{l-1} * \delta^l$
$\partial w^l$ 的维度为： $f_w * f_h * C^{l-1} * K$

卷积层偏置的偏导为：为一维向量，大小为K
$\partial b^l = \Sigma_{u,v} \delta^l$

偏置 $\partial b^l$ 不是简单等同于 $\delta^l$ , 需要对 $\delta^l$ 在 $W^l * H^l$ 维度上求和。

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成，浏览时请结合常识与多方信息审慎甄别。
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

相关阅读更多精彩内容

cs231n课程笔记：卷积神经网络
笔记参考：https://zhuanlan.zhihu.com/p/22038289?refer=intellig...
spectre_hola阅读 9,557评论 0赞 26
神经网络DNN的前向传播和后向传播
最近看了不少吴恩达的视频，听了不少神经网络的前向和后向传播的介绍，也看了不少的公式，很多东西看过了，不见得记住了...
千足下阅读 5,036评论 0赞 2

卷积神经网络——卷积层、池化层和激活函数
2018年11月20日，在看tensorflow的时候发现还是有很多概念没有理解透彻，发现一个很赞的资源（估计大家...
欠我的都给我吐出来阅读 23,719评论 4赞 7
刷脸背后，卷积神经网络的数学原理是这样的
《AI先锋周刊》是—家关注人工智能学术研究、产业生态链、技术落地、边缘应用等维度的先锋电子新媒体。欢迎广大热爱AI...
AI女神安娜阅读 3,452评论 0赞 3
Mac系列-002：触控板
以前不用Mac的时候，觉得触控板真是太反人类了，压根不知道怎么操作。而现在呢，反而成了我最喜欢的设备。大部分时候，...
Poorzerg阅读 4,712评论 0赞 0

友情链接更多精彩内容

1赞2赞

赞赏

手机看全文