Residual Attention Network for Image Classification

这是CVPR的文章,讨论关于注意力机制在分类的应用。
paper
github
容易理解的代码

通过使用sigmoid函数对主干网络构建mask,在特征上添加掩码,使网络更加关注主要的特征。

图中Attention Module是注意力模块。在Attention Module模块中上面的通道是主干网络,下面是注意力mask网络。为保留原有的特征,mask和主干网络的融合有两个操作。首先,通过mask和主干网络的进行点积预算,然后,把点积运算的结果和主干网络相加,得到新的特征。

在两个注意力模块之间有残差块进行连接。

使用encoder-decoder结构可以快速获取全局的信息。

实验三种掩码激活函数:

函数发现其实越简单越好,最好的是sigmoid函数:

使用最少参数,就可以达到和ResNet-152同样的精度:

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容