1.ECA介绍

摘要:最近,通道注意力机制已被证明在提高深度卷积神经网络(CNN)性能方面具有巨大潜力。 然而,大多数现有方法致力于开发更复杂的注意力模块以实现更好的性能,这不可避免地增加了模型的复杂性。 为了克服性能和复杂性权衡的悖论,本文提出了一种高效通道注意(ECA)模块,该模块仅涉及少量参数,同时带来了明显的性能增益。 通过剖析 SENet 中的通道注意力模块,我们凭经验证明避免降维对于学习通道注意力非常重要,适当的跨通道交互可以保持性能,同时显着降低模型复杂性。 因此,我们提出了一种无需降维的局部跨通道交互策略,可以通过一维卷积有效地实现。 此外,我们开发了一种自适应选择一维卷积核大小的方法,确定局部跨通道交互的覆盖范围。 所提出的 ECA 模块高效且有效,例如,我们的模块针对 ResNet50 主干网的参数和计算量分别为 80 vs. 24.37M 和 4.7e-4 GFLOPs vs. 3.86 GFLOPs,性能提升超过 2% 就Top-1准确率而言。 我们以 ResNets 和 MobileNetV2 为骨干,在图像分类、对象检测和实例分割方面广泛评估了我们的 ECA 模块。 实验结果表明,我们的模块效率更高,同时性能优于同类模块。
官方论文地址:https://arxiv.org/pdf/1910.03151
官方代码地址:https://github.com/search?q=ECA&type=repositories
简单介绍: ECA(Efficient Channel Attention)注意力机制的原理可精炼概括为:通过避免在通道注意力模块中引入降维操作,采用了一种创新的局部跨通道交互策略。这种方法巧妙地利用1D卷积来实现高效的通道注意力计算,从而在维持出色性能的同时,大幅减少了模型的复杂性。ECA模块通过自适应选择卷积核大小,精确界定了局部跨通道交互的覆盖范围,实现了参数的高效利用和计算成本的显著降低。在ResNets和MobileNetV2等主流神经网络结构中,ECA模块以极少的参数和计算资源,显著提升了模型的性能,相比其他注意力模块展现出更高的效率和优越性。
ECA模块结构图:

2107

被折叠的 条评论
为什么被折叠?



