论文阅读:Improving Convolutional Networks with Self-calibrated Convolutions

这周开始忙碌,有任务的暑假就不是假期,还是想做咸鱼快乐每一天呀!今天还是论文阅读记录,是来自最新cvpr2020里面的SCnet网络的介绍。

论文名称:
《Improving Convolutional Networks with Self-calibrated Convolutions》
论文地址:
http://mftp.mmcheng.net/Papers/20cvprSCNet.pdf
代码地址:
https://github.com/MCG-NKU/SCNet
论文阅读参考:https://blog.csdn.net/weixin_42096202/article/details/105876498
https://blog.csdn.net/baidu_32335419/article/details/106930914
本篇文章只记录个人阅读论文的笔记,具体翻译、代码等不展开,详细可见上述的链接.

Background

Recent advances on CNNs are mostly devoted to designing more complex architectures to enhance their representation learning capacity.
we consider improving the basic convolutional feature transformation process of CNNs without tuning the model architectures
CNN的最新进展主要致力于设计更复杂的体系结构,以增强其特征表示能力。而本文另辟蹊径,考虑在不调整模型架构的情况下改进CNN的基本卷积特征转换过程,进而增强输出特征的多样性(表达能力)。

Related Work
当前CNN网络的优化主要有两个方面:
1.Architecture Design(结构设计):
Alext-VGG-GoogleNet-ResNet-DenseNet-ResNeXt-NasNet
2.Long-Range Dependency Modeling(长距离依赖建模(注意力机制)):SENet-GENet-CBAM-GCNet-GALA-AA-NLNet

Work

Do?
we present a novel self-calibrated convolution that explicitly expands fields-of-view of each convolutional layer through internal communications and hence enriches the output features.
我们提出了一种自校正卷积(多个卷积注意力组合的模块),替换基本的卷积结构,在不增加额外参数和计算量的情况下,该卷积可以通过特征的内在通信达到扩增卷积感受野的目的,进而增强输出特征的多样性。相比于标准卷积,该卷积通过自校正操作自适应地在每个空间位置周围建立了远程空间和通道间依存关系,从而使得产生的特征图更具有区分度。
Advantages
As an augmented version of the standard convolution,our self-calibrated convolution offers two advantages.
作为标准卷积的一种增强版本,自校准卷积有两个优势:
1.First,it enables each spatial location to adaptively encode informative context from a long-range region, breaking the tradition of convolution operating within small regions
2.Second, the proposed self-calibrated convolution is generic and can be easily applied to standard convolutional layers without introducing any parameters and complexity over�head or changing the hyper -parameters.
1、 首先,它使每个空间位置都能自适应地编码远距离区域的信息上下文,从而打破了在小区域(例如3x3)内进行卷积的传统。 这使自校正卷积产生的特征表示更具辨识性。
2、 其次,提出的自校正卷积是通用的,可以轻松应用于标准卷积层,而无需引入任何参数和复杂性开销或更改超参数。

在上图中,将ResNet生成的具有不同类型卷积的特征激活图可视化,可以看出,具有自校正卷积的ResNet可以更准确和整体地定位目标对象,并且采用SCNet的输出对前景有明显的分割。

Model
在介绍整个模型之前,先回顾一下以往的常规卷积操作
假设输入特征为X=[x_1,x_2,…x_{ci}]输出特征为Y=[y_1,y_2,…y_{co}],那么传统的2D卷积由一组滤波器集合K=[k_1,k_2,…k_{co}]构成。此时常规卷积公式可以描述如下:

[注意: 其中‘*’表示卷积,在这里,输入C X H X W ,在输出通道也为C的卷积中,卷积核K的维度为C X C X H X W。]
常规卷积的缺点:
1.这种卷积的卷积核学习模式都具有相似性。
2.卷积特征变换中每个空间位置的视野主要由预定义的内核大小控制,由此类卷积层的堆叠组成的网络也缺少大的感受野,无法捕获足够的高级语义。以上缺点都可能导致特征图的辨识度较低。

自校正卷积(Self-Calibrated Convolutions)

整个模型的具体结构如上图所示,先进行概述再分布展开
概述
先考虑一种简单的情况,即输入通道数和输出通道数相当,即C=C'。给定一组卷积核集K,形状为(C,C,k_h,k_w),其中k_h,k_w对应卷积核的高和宽。首先将卷积核集平均分成4部分,每部分负责不同的作用。假设C可以被2整除,这样子得到四组卷积核,用[{K_i}]^4_{i=1}表示,相应的每部分的形状为(C/2,C/2,k_h,k_w).
有了四组卷积核后,我们平均的划分输入数据X为两部分x1,x2,之后分别送入一个特殊通路用于获取不同的上下文信息。在第一个通路上,我们使用了K2,K3,K4来对X1进行自校准操作,从而获得输出Y1。 在第二个通路上,我们使用了一个简单的卷积操作:Y_2=F_1(X_2)=X_2*K_1,从而保有原始的空间信息。之后将中间输出结果Y1,Y2串联在一起,得到输出Y.

具体步骤
第一,输入特征图X为C X H X W大小,拆分为两个C/2 X H X W大小的X1,X2;
第二,卷积核K的维度为C X C X H X W,将K分为4个部分,每份的作用各不相同,分别记为K1,K2,K3,K4,其维度均为C/2 X C/2 X H X W;

为了有效地收集每个空间位置的丰富的上下文信息,作者提出在两个不同的尺度空间中进行卷积特征转换:原始尺度空间中的特征图(输入共享相同的分辨率)和下采样后的具有较小分辨率的潜在空间(用于自校正) 。利用下采样后特征具有较大的感受野,因此在较小的潜在空间中进行变换后的嵌入将用作参考,以指导原始特征空间中的特征变换过程。
第三,自校准尺度空间:
1.给定输入x1,我们使用滤波器尺寸为r×r步长为r(论文r=4)进行平均池化,公式如下:

2.对T1使用卷积核组K2进行特征变换:
其中,Up()表示线性插值操作也称为上采样操作,从而实现,中间参考量从小尺度空间到原始特征空间的映射。
此时,自校准操作可以表示为:
其中,F3(X1)=X1*K3,表示 sigmoid函数,以及符号”·“表示逐元素乘运算,X1被用作残差项,来建立权重,用于自校准。
自校准后的最终输出可以写作:

Advantages:
The advantages of the proposed self�calibration operation are three-fold.
1.与传统的卷积相比,通过采用校正操作允许每个空间位置不仅将其周围的信息环境自适应地视为来自低分辨率潜在空间的嵌入,以作为来自原始比例空间的响应中的输入,还可以对通道间依赖性进行建模。因此,可以有效地扩大具有自校准的卷积层的感受野。如下图所示,具有自校准功能的卷积层编码更大但更准确的区分区域。

2.其次,自校准操作不收集全局上下文,而仅考虑每个空间位置周围的上下文,从而在某种程度上避免了来自无关区域的某些无用信息。 从下图的右两栏中可以看出,在可视化最终分数层时,具有自校准功能的卷积可以准确地定位目标物体。
3、自校准操作对多尺度信息进行编码,这是与目标检测相关的任务非常需要的。
总的来说,文中的self-Calibrated Convolutions就是一个多尺度特征提取模块。作者通过特征图下采样来增大CNN的感受野,每个空间位置都可以通过自校准操作融合来自两个不同空间尺度空间的信息。而且,Self-Calibrated Convolutions没有引入额外的可学习参数,但是其计算量还是会增大。

Experiment

1.比较ImageNet-1k数据集上使用不同分类框架的测试结果

实验中的训练过程参考ResNeXt文章中的训练,将SCNet引入其他backbone,无论ResNet、ResNeXt还是SE-ResNet均可得到一定程度的性能提升。

2.关于SCNet设计的消融实验
当下采样率为4,池化方式为均值池化时具有最佳性能。
3.在ImageNet上使用的基于注意力机制方法的比较

将其与其他注意力机制(CBAM、SENet、GALA、AA、GE等)方法进行了性能对比。其他注意力机制方法大多需要额外的可学习参数,而本文所提方法则无需额外可学习参数

4.在coco minival数据集上,与最优方法的比较
扩展实验:将所提方案拓展到目标检测、关键点检测、实例分割等应用领域,进一步验证了所提方案的性能,可以一致性的提升改善模型的性能。
(注:评价指标具体意义如下图所示)
https://blog.csdn.net/weixin_38145317/article/details/106405245?utm_medium=distribute.pc_relevant_t0.none-task-blog-BlogCommendFromMachineLearnPai2-1.nonecase&depth_1-utm_source=distribute.pc_relevant_t0.none-task-blog-BlogCommendFromMachineLearnPai2-1.nonecase

Ending~

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 219,589评论 6 508
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 93,615评论 3 396
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 165,933评论 0 356
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,976评论 1 295
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,999评论 6 393
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,775评论 1 307
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,474评论 3 420
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,359评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,854评论 1 317
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 38,007评论 3 338
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 40,146评论 1 351
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,826评论 5 346
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,484评论 3 331
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 32,029评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,153评论 1 272
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,420评论 3 373
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 45,107评论 2 356