语义分割系列论文-Residual Attention Network for Image Classification(残差注意力网络)
文章目录
摘要
作者提出了“残差注意网络”,这是一个使用注意机制的卷积神经网络,可以结合先进的前馈网络结构,以端到端的训练方式,残差注意网络是通过堆叠注意模块来生成注意感知特征。不同模块的注意感知特征随着层次的加深而自适应地变化。在每个注意模块内部,采用自底向上、自顶向下的前馈结构,将前馈和反馈的注意过程展开为单个前馈过程。重要的是,我们提出的注意残差学习可以训练非常深的残差注意网络,它可以很容易地扩展到数百层。该网络对噪声标签是鲁棒的。
Introduction
首先作者介绍了在视觉领域中Attention也发挥着很大的作用,Attention不止能使运算聚焦于特定区域,同时也可以使得该部分区域的特征得到增强,同时‘very deep’的网络结构结合残差连接(Residual NetWork)在图像分类等任务中表现出了极好的性能。基于这两点考量,作者提出了残差注意力网络(Residual Attention Network),这种网络具有以下两点属性:
(1)增加更多的注意力模块可以线性提升网络的分类性能,基于不同深度的特征图可以提取额外的注意力模型。
(2)残差注意力模型可以结合到目前的大部分深层网络中,做到end-to-end训练结果,因为残差结构的存在,可以很容易将网络扩展到百数层。并且使用该种策略可以在达到其他大网络的分类准确率的同时显著降低计算量(计算量基本上为ResNet大网络的69%左右)

上图中左图显示了在残差注意力网络中主干网络和注意力模块之间的关系,注意力模块为主干网络以某一个特征图为节点的分叉子网络;右图中的结果显示网络模型中,不同层特征图响应的注意力不同,在浅层结构中,网络的注意力集中于背景等区域,而在深层结构中,网络的注意力特征图(Attention Feature Map)聚焦于待分类的物体。这与之前的很多工作结论类似,那就是深层次的特征图具有更高的抽象性和语义表达能力,对于物体分类较浅层特征有较大的作用。
本文的主要贡献点为:

2371

被折叠的 条评论
为什么被折叠?



