Resnet两篇论文阅读纪要

Resnet两篇论文阅读纪要

《Deep Residual Learning for Image Recognition》

论文围绕的核心问题是:Is learning better networks as easy as stacking more layers?

也就是说如果加深网络是否可以使学习效率得到提高,重点瞄准于解决degradation problem

degradation问题描述

​ 简单来说就是当网络(plain network)的深度加深时,网络的训练误差不降反升。一般来讲,当模型的复杂度提高时,而数据集不变,那么有可能造成一定的过拟合,训练误差应该下降。然而当作者把网络堆叠成更深层的网络时,训练误差和测试误差都比浅层网络的更大。通过分析反向传播过程(backprogadation),深层网络的梯度值在反向传播的过程中逐渐减小直到最后消失,也就是常说的梯度消失(vanishing gradient)问题。

基本思路

​ 论文提出了一种由残差块(building block和bootleneck)堆叠而成的深度网络结构,理想情况下,这种结果可以无限加深,影响其性能的主要是过拟合。

​ building block和bootleneck的结构如下:


building block和bottleneck结构

残差学习

​ 作者主要利用了两个概念来构建残差网络,第一个是残差表达(residual representations),第二个是跨桥连接(Shortcut Connections)

​ 残差表达/残差学习: 假设网络的特征函数为H(x),如果网络能够学习得到H(x),那么也能够学习到残差函数H(x)-x,因此可以令残差函数F(x):=H(x)-x,使building block中堆叠的网络学习残差函数。以恒等映射x为参考训练F(x)比直接训练H(x)更容易收敛,并且每层网络的响应的方差也会更小,分布更集中。

​ 跨桥连接(identity mapping/skip connection):这个结构在第二篇论文中进行了详细分析,主要作用是使残差单元(residual unit)的前向和后向过程具有直通的作用。后向梯度传播的过程中,不论网络的梯度如何小,它们总会通过identity mapping/skip connection直接反向传递到上一个unit,也就是说,梯度总是大于1的。这种结构在一定程度上解决了梯度消失的问题,从而使更深的网络成为可能。

残差网络的结构图

实验训练过程

《Deep Residual Learning for Image Recognition》

文章概要

文章分析了使用跨连接(skip connection)的残差块(residual building block)的前向和反向传播过程。这个过程表明了恒等映射的(identity mapping)的跨连接结构(skip connection)可以使前向和反向信号在残差单元(residual unit)间直接传递。文章从理论上分析了identity mapping结构的skip connection可以有效解决梯度消失的问题,从而使网络加深。
要使残差单元(residual unit)满足恒等映射(identity mapping)要满足两个条件:
condition1: the identity skip connection is h(xl)=xl.
condition2:the activation function f is a identity function: f(yl)=yl.
全文就是从这两个条件出发变换各种形式以及做了多个对比实验,最后得出最高效的residual unit结构(称为pre-activation),结构图如下:


变换activation function的位置

数学推导

residual unit的数学表达式

在identity mapping的条件下h(xl)=xl,f(yl)=yl,前向过程后反向梯度计算过程变为如下形式。


前向计算

反向计算梯度

从上式中可以看出梯度总是大于1的,所以从理论上是可以避免梯度消失的问题。

condition1实验

这一系列实验主要测试skip connect的结构对准确率的影响,作者设计了五种结构,分别是constant scaling, exclusive gating, shortcut-only gating, conv shortcut, dropout shortcut五种结构,如图所示。


五种shortcut(skip connection)结构

实验结果如下:


shortcut的实验结果

最后得出结论clean skip connection是效果最好的,这也印证了上述数学推导过程中h(xl)=xl的条件。
值得注意的是,作者在文章中提到1x1 conv shortcut和gating shortcut这两种结构实际上增强了网络的表达能力,但是对于深层次网络来说优化问题和degradation problem可能是更主要的问题。

condition2实验

这个部分的实验是使激活函数具有恒等映射(identity mapping)的能力。作者通过调整relu和bn在网络的中的位置得到了多种结构并做了对比实验,结构如下。



实验结果,



最后表明full pre-activation的结果最佳。
这个变换的主要思想是将relu放到下一个residual unit的weight之前,那么上一个weight的输出可以直接输入到下一个unit,也就满足了f(yl)=yl的条件,使其成为恒等映射。对比最后两个结构的主要区别在于BN的位置,因为从skip connection的数据可能发生了偏移,如果不经过BN直接输入到ReLU单元中示,可能会导致ReLu饱和,梯度无法传播,从而导致训练误差增大。在ReLU之前加入BN保证了数据分布的有效性,结果表明full pre-activation的结构的效果也是最好的。

参考

[1] He, K., Zhang, X., Ren, S., Sun, J.: Deep residual learning for image recognition. In: CVPR. (2016)
[2] He, K., Zhang, X., Ren, S., Sun, J.: Identity Mappings in Deep Residual Networks. In: ICCV. (2016)

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 213,558评论 6 492
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,002评论 3 387
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 159,036评论 0 349
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,024评论 1 285
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,144评论 6 385
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,255评论 1 292
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,295评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,068评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,478评论 1 305
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,789评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,965评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,649评论 4 336
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,267评论 3 318
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,982评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,223评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,800评论 2 365
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,847评论 2 351