1 文章简介
方向:语义分割
会议:CVPR2019
2 主要思想
在语义分割任务中添加更多的上下文信息(关系)。语义分割任务主要关注于两点:
(1)语义信息:通俗点说语义信息就是'这是个什么东西',是图像中物体可分辨特征的集合, 得到的语义信息越多,越能够区别不同的物体。获得更多语义信息的方法主要有 a: 增大感受野,直观上说看的越多,对这个物体了解的越多。 b: 融合不同level的特征(跳连接):直观上说就是通过物体的整体特征与局部特征对物体进行分辨。
(2) 上下文信息: 通俗点说就是'这个东西和其他东西的之间有什么关系', 在CNN中建立上下文信息也就是关系,是比较复杂的因为CNN是建立在欧式网格上的,也就是2维网格,不能建立3维或者多维以上的关系。针对这一缺点发展出来的是GCN即图网络,可以用于关系。这也有其缺点。在17年的一篇self-attention[2] 和 18 年的一篇 relation moudle[1]的论文出现, 成功的在网络里建立的关系模块,今年cvpr2019出现了很多类似的文章。
3 本文提出的方法
3.1 Spatial Relation Module
公式:
空间attention 模块,如图2 所示一个w=h=6, c=3 的特征图,空间注意力就是把特征图分解为wxh个子特征构成,每个子特征的维度为c,即图2中共有wxh=36个子特征,每个子特征的维度为c=3. 现在想对第i个特征(蓝色区域)建立与其他特征的空间关系。也就是第i个特征与其他35个特征建立关系。如第j个特征(黑色部分)建立关系的方法如公式(1)(2)所示。公式(说明)两个特征之间的关系首先用其外积建立。然后经过公式(1)中的f函数进行转换。
其具体计算流程为:
3.2 Channel Relation Module
对应公式:
思路同上
3.3 使用
4实验
参考文献:
[1] Relation Networks for Object Detection arXiv:1711.11575v2
[2] Attention Is All You Need