7组-MobileNets: Efficient Convolutional Neural Networks for Mobile Vision Applications

主要贡献

  1. 提出MobileNets模型,该模型使用depthwise separable卷积构建轻量级网络,可用于智能手机及嵌入式设备中

  2. 引入两个超参数,用于控制模型的性能及效率,在不同的应用场景可选取合适的超参数

  3. 在目标检测、图像细粒度分类、人脸属性分类和大尺度地理定位等任务中验证了该模型的有效性

研究背景及动机

近年来,卷积神经网络在图像识别、检测等领域取得了惊人的成功。从AlexNet到VGGNet再到ResNet,为了提高准确率,网络总体朝着更深更复杂的趋势发展。然而,在某些计算资源有限的应用场景,如智能手机、机器人、自动驾驶,处理速度同样重要。

目前,获取小型高效的神经网络的方法可以粗略地分为压缩现有训练好地网络和直接训练小网络这两类。

压缩类方法有参数量化、哈希、Huffman编码、蒸馏等。

直接训练类方法采用卷积分解等手段,使用小卷积的组合取代大卷积,从而设计出轻量级的小网络,如:

  • Flattened networks,将一个三维卷积分解成了三个一维的卷积

  • Factorized networks,减少输出通道和输入通道的连接数量

  • Xception network,使用depthwise separable卷积

  • Squeezenet,引入bottleneck,大量使用1x1和3x3的卷积

MobileNet

depthwise separable卷积

这是一种分解卷积的形式,它将标准卷积分解为depthwise卷积和pointwise卷积,即1×1卷积。depthwise卷积对每个输入通道应用单个滤波器,pointwise卷积组合输出的depthwise卷积。标准卷积同时进行滤波和组合,而depthwise separable卷积将其分成两层,一层用于滤波,一层用于组合。这种分解具有大幅度减少计算和模型大小的效果。

上图比较了标准卷积和分离后的两个卷积,其中标准卷积的计算成本为

而depthwise separable卷积的计算成本为

两者之比为

可以看出,输出通道数N和卷积尺寸Dk越大,计算成本节省越大。

网络结构和训练

如上表所示,MobileNet共有28层,每个卷积层后均接着batchnorm和ReLU,使用步长为2的卷积取代maxpool进行下采样,在全连接层之前使用avgpool将特征图下采样到1x1大小,而不是像AlexNet一样直接展开,这大大减少了参数量。

此外,通过对上述网络的进一步分析,注意到1x1卷积贡献了大部分参数量及加-乘次数。计算量不能简单地使用加-乘次数来衡量,这是因为卷积运算通常由高度优化的通用矩阵乘法(GEMM)实现,这种实现需要首先需要对输入在内存中进行重排,然后再进行GEMM,而1×1卷积不需要重排,可以直接使用GEMM来实现,因此占用大量加-乘次数的1x1卷积实际并不会增加太多计算量。

MobileNet使用RMSprop的优化策略。与训练大型模型不同,MobileNet使用较少的正则化和数据增强技术,这是因为小模型通常不会被过拟合所困扰。

Width Multiplier

虽然基础MobileNet架构已经很小而且计算很快,但特殊情况下可能要求模型更小更快。为了构造更小更快的模型,引入一个非常简单的参数α,称为Width Multiplier。α的作用是在每层均匀地减薄网络。对于给定的层和α,输入通道数由M变为αM ,输出通道数由N变为αN。

具有参数α的depthwise separable卷积的计算成本为

其中α∈(0, 1],典型取值为1, 0.75, 0.5和0.25。Width Multiplier使计算成本和参数数量大致减少α2,其可应用于任何模型结构,适当的权衡精度、模型大小和速度来产生新的较小模型。

Resolution Multiplier

用于降低神经网络计算成本的第二个超参数是Resolution Multiplier ρ,其将输入的图像分辨率变为原来的ρ倍。

加入参数α和参数ρ的depthwise separable卷积的计算成本为

其中ρ∈(0, 1],通常设置使得网络的输入分辨率为224, 192, 160或128。Resolution Multiplier使计算成本和参数数量减少ρ2

上表分别展示了depthwise separable卷积、参数α和参数ρ对计算量及参数量缩减贡献的一个例子,可以看出缩减是十分明显的。

实验

ImageNet

从上表可以看出,使用depthwise separable卷积与标准卷积相比,ImageNet上的识别精度仅降低1%,但大大减少了参数量和计算量。同时也可以看出两个超参数对精度、模型大小、计算量的影响。注意到,缩减层数产生的Shallow网络虽然同样减少了原网络的计算量和参数,但不如引入Width Multiplier的Narrow网络更有效,后者相比前者在更少的参数和少量的计算量增加下带来了3.1%的精度提升。

从上面两个图中可以粗略看出MobileNets中计算量、模型参数量对ImageNet识别精度的影响。在实际应用中,根据不同的需求,通过调节Width Multiplier和Resolution Multiplier权衡精度、模型大小和速度,训练最合适的模型。

细粒度识别

在Stanford Dogs数据集上,MobileNet在大大减少计算量和参数量的情况下取得了state of the art的结果。

大尺度地理定位

PlaNet将确定拍摄照片的地点作为分类问题。该方法将地球划分为一个地理单元网格,用作目标类别,并使用卷积神经网络对数百万带有地理标记的照片进行训练。PlaNet够成功地定位各种各样的照片,并且远胜解决相同任务的Im2GPS。

使用MobileNet取代原有Inception V3在相同的数据上重新训练PlaNet。如上表所示,相比原版PlaNet,MobileNet版本性能略有下降,但其仍大幅优于Im2GPS。

人脸属性分类

使用蒸馏(在模型压缩中提到过)技术训练MobileNet用于人脸属性分类,结果很优秀。注意到在该任务中,mAP对大幅度的模型缩减表现得很有弹性,这也表明了合理的选择上述两个超参数可以在大幅提高效率的同时保证性能。

目标检测

在MS COCO目标检测数据集上,使用MobileNet替换SSD、Faster-RCNN等通用目标检测框架中原有的网络。

人脸识别

FaceNet是一个state of the art的人脸识别模型,使用蒸馏技术在FaceNet模型的指导下训练MobileNet。

总结

MobileNets是基于depthwise separable卷积设计出的一系列卷积神经网络,其能够在保证性能的情况下,大幅缩减模型大小和计算量。文中通过不同任务下的对比实验,已表明其有效性和普适性,能够胜任深度学习模型在智能手机等计算受限情况下的实际部署。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 204,293评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,604评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,958评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,729评论 1 277
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,719评论 5 366
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,630评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,000评论 3 397
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,665评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,909评论 1 299
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,646评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,726评论 1 330
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,400评论 4 321
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,986评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,959评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,197评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 44,996评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,481评论 2 342

推荐阅读更多精彩内容