【paper】Deep Residual Learning for Image Recognition

这篇论文是2016cvpr最佳论文，该论文提出了一种残差网络的模型，很大程度上解决了深度网络难以学习的问题。作者使用152的残差网络在2015 ImageNet 分类和检测的比赛中均获得第一名。

退化问题

随着网络深度加深，网络的训练准确率却不断下降，这个问题不是由过拟合引起的。

这种现象是不合理的。

假设我们有浅层网络Net1，深层网络Net2，我们让Net1完全替代Net2的前半部分网络，Net2的后半部分网络我们做恒等映射。那么Net2的训练准确率应比Net1高（至少不比Net1低）。但实际训练情况并非如此。

这说明，并不是所有的网络都易于优化。

残差学习

作者提出了下面的网络模型

网络的期望输出是H(x)，我们让F(x) + x去拟合H(x)，即 H(x) := F(x) + x。
有 F(x) := H(x) - x
假设恒等映射是最优解，那么，训练残差函数F(x)等于零要比在一个多层非线性网络上训练恒等映射要容易。

解决x与F(x)维度不等的问题

作者给出两种解决方案

identity mapping
通过给低维的x加0来增加维度，这种方式不会增加多余的参数；（parameter-free）
projection shortcut
给x乘以一个投影矩阵：

实验表明：identity mapping is sufficient for addressing the degradation problem and is economical, and thus Ws is only used when matching dimensions.

网络结构

左边是VGG-19网络，中间是没有shortcut-connection的平凡网络（plain net），右边是34层的残差网络（ResNet-34）。
作者说ResNet-34 与VGG相比有更少的卷积核和更低的复杂度，与VGG-19相比参数减少18%。那当然了，人VGG-19有两个4096的全连接层，你虽然深，但都是卷积核啊。

实验-ImageNet Classification

一些基本设置

数据增强
adopt batch normalization right after each convolution and before activation
use SGD with a mini-batch size of 256
the learning reate starts from 0.1 and is divided by 10 when the error plateaus
the models are trained for up to 60*10^4 iterations
use a weight decay of 0.0001 and a momentum of 0.9
do not use dropout

Residual Networks 实验一：Plain Net vs. ResNet

18-layer和34-layer 残差网络，基本结构与plain net类似，应用identity mapping 实现 shortcuts，因此相比plain net没有增加参数。

由Figure4的结果可知：

ResNet很好的解决了退化问题，并且随着深度加深，准确率增高；
与Plain Net相比，ResNet-34 error减小了3.5%，这说明残差学习在极深度网络中的有效性；
与Plain Net相比，RestNet能够更快的收敛。

Residual Networks 实验二：Identity mapping vs. Projection Shortcuts

A：需要升维的shortcuts使用zero-padding方式，其他的shortcuts使用identity mapping方式，没有参数增加；
B：需要升维的shortcuts使用projection，其他shortcuts使用identity mapping；
C：所有的shortcuts都使用projection。

Small differences among A/B/C indicate that projection shortcuts are not essential for addressing the degradation problem.

Residual Networks 实验三：Deeper BottleNeck Architectures

这个就是设计的152层的网络，top-1的错误率19.38%，top-5错误率4.49%，据说已经超过了人眼的识别水平。

实验-CIFAR-10 and Analysis

然后作者又设计了一个1000多层的网络并在CIFAR-10数据集上进行训练，误差率比千层网络高了一点，作者猜测是数据集太小过拟合了。想想也是，拿大炮打蚊子效果肯定不好。作者的原话是“We argure that this is because of overfitting. The 1202-layer network may be unnecessarily large(19.4M) for this small dataset.”

然后作者又做了个分析，输出了一下每层卷基层的输出的标准差，见下图。

层数越深，标准差越小。这似乎说明了什么，作者的结论是：These results support our basic motivation that the residual functions might be generally closer to zero than the non-residual functions.
说实话，我没怎么理解，因为你拿到的是标准差不是均值，标准差小只说明输出的数据比较聚合而已，怎么能说说明趋近于0呢？

最后编辑于：2017.12.05 03:09:24

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 216,470评论 6赞 501
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 92,393评论 3赞 392
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 162,577评论 0赞 353
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 58,176评论 1赞 292
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 67,189评论 6赞 388
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 51,155评论 1赞 299
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 40,041评论 3赞 418
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 38,903评论 0赞 274
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 45,319评论 1赞 310
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 37,539评论 2赞 332
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 39,703评论 1赞 348
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 35,417评论 5赞 343
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 41,013评论 3赞 325
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 31,664评论 0赞 22
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 32,818评论 1赞 269
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 47,711评论 2赞 368
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 44,601评论 2赞 353