登录注册写文章

轻量级网络MobileNetv1-MobileNetv2-MobileNetv3

轻量级网络MobileNetv1-MobileNetv2-MobileNetv3

MobileNetv1

MobileNets: Efficient Convolutional Neural Networks for Mobile Vision Applications
论文地址：[https://arxiv.org/pdf/1704.04861.pdf]

1 Depthwise Separable Convolution

Dk:kernel size Df :feature map size M:input channels
N:output channels
标准卷积
parameters: Dk×Dk×M×N
computation cost: Dk×Dk×M×N×Df×Df

depthwise convolutions and pointwise convolutions
parameters: Dk×Dk×M+N
computation cost: Dk×Dk×M×DF×DF + M×N×DF×DF

dw卷积与标准卷积的比值：

MobileNet uses 3 × 3 depthwise separable convolutions which uses between 8 to 9 times less computation than standard convolutions at only a small reduction in accuracy.

2 Network Structure

如上图所示：MobileNet spends 95% of it’s computation time in 1 × 1 convolutions which also has 75% of the parameters . Nearly all of the additional parametersare in the fully connected layer.

3 Width Multiplier: Thinner Models

image.png

4 Resolution Multiplier: Reduced Representation

MobileNetv2

Inverted Residuals and Linear Bottlenecks: Mobile Networks for Classification, Detection and Segmentation
论文地址：[https://arxiv.org/pdf/1801.04381.pdf]

1 Linear Bottlenecks

当n=2,3等低维度的时候，ReLU会造成大量的信息丢失，而n=15,16 等高维度的时候只会有少量信息丢失。所以把最后一个ReLU6换成了Linear 变换。即linear-bottlenecks

2 Inverted Residuals

v1,v2 结构对比，v2第一个1×1卷积会扩充维度，因为DW卷积不能改变通道数量，如何input channels 很少，则卷积会在很少的维度进行。所以会先扩充维度。

带下采样的bottleneck residual block

3 Model Architecture

MobileNetv3

Searching for MobileNetV3
论文地址：https://arxiv.org/pdf/1905.02244.pdf

1 S-E Block

v3 在v2的基础上加入了注意力模块，而且不同于SENET的是将其加在DW卷积后面，这样SEblock中的channels 会更多。

2 Network Search 这个还没搞明白，后续会更新

2.1 Platform-Aware NAS for Block-wise Search

2.2 NetAdapt for Layer-wise Search

3 Redesigning Expensive Layers对V2最后阶段的修改

在mobilenetv2中，在avg pooling之前，存在一个1x1的卷积层，目的是提高特征图的维度，更有利于结构的预测，但是这其实带来了一定的计算量了，所以这里作者修改了，将其放在avg pooling的后面，首先利用avg pooling将特征图大小由7x7降到了1x1，降到1x1后，然后再利用1x1提高维度，这样就减少了7x7=49倍的计算量。并且为了进一步的降低计算量，作者直接去掉了前面纺锤型卷积的3x3以及1x1卷积，进一步减少了计算量，就变成了如下图第二行所示的结构，作者将其中的3x3以及1x1去掉后，精度并没有得到损失。这里降低了大约15ms的运行时间。

4 h-swish

swish论文的作者认为，Swish具备无上界有下界、平滑、非单调的特点。
swish x = x · σ(x)
把sigmoid 用ReLU(6) 替换变成hard-swish:

5 Network Architecture

最后编辑于：2019.08.25 17:22:03

©著作权归作者所有,转载或内容合作请联系作者
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

推荐阅读更多精彩内容

Inception-V3论文翻译——中英文对照
文章作者：Tyan博客：noahsnail.com | CSDN | 简书声明：作者翻译论文仅为学习，如有侵权请...
SnailTyan阅读 6,761评论 0赞 4
30组-MobileNets论文解读和MobileNetV2简介
引言深度学习能够很好解决部分计算机视觉相关的问题，但是其需要依靠强大的计算能力作为支撑。深度学习在能耗有限，计算...
Joeyeee阅读 7,861评论 0赞 4
深度神经网络架构发展概述
作者：Eugenio Culurciello翻译：叶俊贤校对：叶俊贤原文链接：https://medium.com...
叶俊贤阅读 9,063评论 2赞 34
【诗】朋友（二）
请不要对我说，我的朋友，我知道，这是你的真心话，这是你对我的疼惜。可是我的朋友，请不要这样子说，我并...
未明花香阅读 224评论 0赞 1
大时代
最近开始看TVB神剧大时代，一方面恨的丁家牙痒痒，一方面又觉得编剧只是把生活中大家的某个部分夸张化，其实每个人一定...
西西爱海阅读 218评论 0赞 1

赞1赞

赞赏

手机看全文