ESPNet/ESPNetV2:空洞卷积金字塔 | 轻量级网络

ESPNet系列的核心在于空洞卷积金字塔,每层具有不同的dilation rate,在参数量不增加的情况下,能够融合多尺度特征,相对于深度可分离卷积,深度可分离空洞卷积金字塔性价比更高。另外,HFF的多尺度特征融合方法也很值得借鉴

来源:晓飞的算法工程笔记 公众号

ESPNet


论文: ESPNet: Efficient Spatial Pyramid of Dilated Convolutions for Semantic Segmentation

Introduction

  ESPNet是用于语义分割的轻量级网络,核心在于ESP模块,该模块包含point-wise卷积和空洞卷积金字塔,分别用于降低计算复杂度以及重采样各有效感受域的特征。ESP模块比其它卷积分解方法(mobilenet/shufflenet)更高效,ESPNet能在GPU/笔记本/终端设备上达到112FPS/21FPS/9FPS。

ESP module

  ESP模块将标准卷积分解成point-wise卷积和空洞卷积金字塔(spatial pyramid of dilated convolutions),point-wise卷积将输入映射到低维特征空间,空洞卷积金字塔使用Kn\times n空洞卷积同时重采样低维特征,每个空洞卷积的dilation rate为2^{k-1}k=\{1, \cdots, K\}。这种分解方法能够大量减少ESP模块的参数量和内存,并且保持较大的有效感受域。

  • Width divider K

  对于输入输出维度为MN,卷积核大小为n\times n的标准卷积,需要学习的参数量为n^2MN,有效感受域为n^2。超参数K用来调节ESP模块的计算复杂度,首先使用point-wise卷积将输入维度从M降为\frac{N}{K}(reduce),然后将低维特征分别使用上述的空洞卷积金字塔进行处理(split and transform),最后将K组空洞卷积的输出合并(merge)。ESP模块包含\frac{MN}{K}+\frac{(nN)^2}{K}参数,有效感受域为[(n-1)2^{K-1} + 1]^2,在参数和感受域方面都有一定的提升。

  • Hierarchical feature fusion (HFF) for de-gridding

  论文发现,尽管空洞卷积金字塔带来更大的感受域,但直接concate输出却会带来奇怪网格纹路,如图2所示。为了解决这个问题,在concate之前先将输出进行层级相加,相对于添加额外的卷积来进行后处理,HFF能够有效地解决网格纹路而不带来过多的计算量。另外,为了保证网络的梯度传递,在ESP模块添加了一条从输入到输出的shortcut连接。

Relationship with other CNN modules

  论文列举了部分轻量级网络的核心模块进行了对比,可以看到ESP模块在参数量/内存/感受域方面都有很不错的数值。

ESPNet

  图4为ESPNet的演进过程,l为特征图大小,相同l的模块具有相同大小的特征图,红色和绿色模块分别为下采样和上采样模块,一般无说明即\alpha_2=2\alpha_3=8

Experiments

  这里只列举了部分实验,具体的其它实验可以去看看论文。

  替换图4d中的ESP模块进行实验对比。

  与其它语义分割模型进行对比。

Conclusion

  ESPNet是语义分割的轻量级网络,在保证轻量化的同时,针对语义分割的场景进行了核心模块的设计,使用空洞卷积金字塔进行多感受域的特征提取以及参数量的减少,并且使用HFF来巧妙消除网格纹路,十分值得借鉴。

ESPNetV2


论文: ESPNetv2: A Light-weight, Power Efficient, and General Purpose Convolutional Neural Network

Introduction

  模型轻量化共包含3种方法,分别为模型压缩,模型量化以及轻量化设计。论文设计了轻量级网络ESPNetv2,主要贡献如下:

  • 通用的轻量化网络结构,能够支持视觉数据以及序列化数据,即能支持视觉任务和自然语言处理任务。
  • 在ESPNet基础上,加入深度可分离空洞卷积进行拓展,相对于ESPNet拥有更好的精度以及更少的参数。
  • 从实验来看,ESPNetv2在多个视觉任务上有较好的准确率和较低的参数量,任务包括图像分类、语义分割、目标检测。
  • 设计了cyclic learning rate scheduler,比一般的固定学习率的scheduler要好。

Depth-wise dilated separable convolution

  假设输入为X\in \mathbb{R}^{W\times H\times c},卷积核为X\in \mathbb{K}^{n\times n\times c \times \hat{c}},输出为Y\in \mathbb{R}^{W\times H\times \hat{c}},标准卷积、分组卷积,深度分离卷积以及深度可分离空洞卷积的参数量和有效感受域如表1所示。

EESP unit

  论文基于深度可分离空洞卷积以及分组point-wise卷积改进ESP模块,提出了EESP(Extremely Efficient Spatial Pyramid)模块。原始的ESP模块结构如图1a所示,论文首先将point-wise卷积替换为分组point-wise卷积,然后将计算量较大的空洞卷积替换为深度可分离空洞卷积,最后依然使用HFF来消除网格纹路,结构如图1b所示,能够降低\frac{Md+n^2d^2K}{\frac{Md}{g}+(n^2+d)dK}倍计算复杂度,K为空洞卷积金字塔层数。考虑到单独计算K个point-wise卷积等同于单个分组数为K的point-wise分组卷积,而分组卷积的在实现上更高效,于是改进为图1c的最终结构。

  为了更高效地学习多尺度特征,论文提出下采样版本的EESP模块(Strided EESP with shortcut connection to an input image),主要进行以下改进:

  • 修改深度可分离空洞卷积为stride=2的版本。
  • 为模块原本的shortcut添加平均池化操作。
  • 将element-wise相加操作替换为concate操作,这样能增加输出的特征维度。
  • 为防止随着下采样产生的信息丢失,添加一条连接输入图像的shortcut,该路径使用多个池化操作来使其空间大小与模块输出的特征图一致,然后使用两个卷积来提取特征并调整维度,最后进行element-wise相加。

Network architecture

  ESPNetv2的网络结构如表2所示,ESSP模块的每个卷积后面都接BN层以及PReLU,模块最后的分组卷积的PReLU在element-wise相加后进行,g=K=4,其它与ESPNet类似。

Cyclic learning rate scheduler

  在图像分类的训练中,论文设计了循环学习率调度器,在每个周期t,学习率的计算为:

\eta_{max}\eta_{min}分别为最大和最小学习率,T为循环周期。

  循环学习率调度器的可视化如图4所示。

Experiments

  图像分类性能对比。

  语义分割性能对比。

  目标检测性能对比。

  文本生成性能对比。

Conclusion

  ESPNetv2在ESPNet的基础上结合深度分离卷积的设计方法,进行了进一步的模型轻量化,结合了更丰富的特征融合,模型能够拓展到多种任务中,具有很不错的性能。

CONCLUSION


  ESPNet系列的核心在于空洞卷积金字塔,每层具有不同的dilation rate,在参数量不增加的情况下,能够融合多尺度特征,相对于深度可分离卷积,深度可分离空洞卷积金字塔性价比更高。另外,HFF的多尺度特征融合方法也很值得借鉴。



如果本文对你有帮助,麻烦点个赞或在看呗~
更多内容请关注 微信公众号【晓飞的算法工程笔记】

work-life balance.
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 219,635评论 6 508
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 93,628评论 3 396
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 165,971评论 0 356
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,986评论 1 295
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 68,006评论 6 394
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,784评论 1 307
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,475评论 3 420
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,364评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,860评论 1 317
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 38,008评论 3 338
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 40,152评论 1 351
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,829评论 5 346
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,490评论 3 331
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 32,035评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,156评论 1 272
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,428评论 3 373
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 45,127评论 2 356