Small Object Detection via Coarse-to-fine Proposal Generation and Imitation Learning

原创

于 2024-08-28 22:16:35 发布 · 2.3k 阅读

·

45

·

文章的挑战：

先验值与物体区域之间的重叠度较低，导致样本池受到限制，而辨别信息的匮乏则进一步加剧了识别问题。

论文内容概括：

提出了CFINet网络，是一种基于粗-细管道和特征模仿学习的两阶段框架，专门用于小物体检测。

网络具体内容：

1.引入了从粗到细的RPN(CRPN)，通过动态锚选择策略和级联回归，确保为小对象提供足够且高质量的建议。

2.给传统的检测头配备了一个“特征模仿（FI）”分支，以便于以模仿的方式对困惑模型的大小有限的实例进行区域表示。

3.设计了辅助模仿损失，与Faster RCNN集成。

传统的检测网络方法：

首先当前流行的检测器是利用基于重叠的策略和基于距离的策略来选择训练对象的正确值；降低定义正样本的阈值。

有几种方法提出缩小小物体与大物体之间表征距离的方法，大部分都依赖于生成对抗网络或相似性学习。在被认为具有视觉真实性的达吾提的引导下，解析还原尺寸受限实例的特征。

论文思路：

提出了一种基于粗到细通道和人特征模仿学习两阶段小目标检测器CFINet：

1.借鉴了级联RPN中的多级提案生成方案，设计了粗到细RPN（CRPN）：首先采用动态锚选择策略挖掘潜在的先验进行粗回归，然后由区域建议网络对这些细化的锚进行分类和回归。

2.扩展了传统的分类回归设置，增加了一个辅助的特征模仿（FI）分支：利用高质量实例区域特征来指导哪些预测不确定\被误判的对象的学习。

3.设计了一个基于监督对比学习（SCL）的损失函数来优化整个过程。

主要贡献：

1.我们建立了一个名为CRPN的从粗到细的建议生成通道，用于执行从锚点到建议的程序，其中基于区域的锚点挖掘策略和级联回归技术为小实例提供了高质量的建议。

2.在高质量实例的监督下，引入了辅助特征模仿（FI）分支，以丰富使模型感到困惑的低质量实例的表征，并通过基于SCL的定制损失函数对这一新颖分支进行优化。

3.在SODA-D和SODA-A数据集上的实验结果表明，模型检测这些规模极其有限的实例方面具有优势。

国内外研究现状：

一、锚点完善和区域建议：

"完善锚点"和"区域建议"都是为了生成一组更精确的候选区域，确保在后续的目标检测过程中，能够准确识别并定位图像中的目标。

锚点：是一些预定义的边界框，它们在图像的不同位置和不同尺度上进行采样，以捕捉可能的目标，完善锚点的过程是对这些预定义的锚点进行调整和优化，使它们更准确地匹配图像中实际目标的大小和位置。

区域建议：区域建议（Region Proposals）是一种方法，用来从图像中生成一组可能包含目标物体的候选区域。这些候选区域通常是通过某种算法（如Selective Search、RPN等）生成的，并且数量较少，但更有可能包含目标物体。

两阶段：

RPN首次在Faster RCNN中引入，应用于在全卷积网络中生成提案。

1） RPN网络主要包括以下几个步骤：

a.特征提取：使用预训练的卷积神经网络作为特征提取器，提取输入图像的特征图。

B.锚点生成：在特征图上生成多个不同大小和比例的锚点框，这些锚点框覆盖了特征图上的不同位置。

C.区域提议：使用卷积层对特征图进行进一步处理，生成每个位置的分数，这些分数表示该位置是否包含目标以及目标的类别。

D.非极大值抑制（NMS）：对生成的候选框进行筛选，去除重叠度过高的框，只保留得分最高的几个框。

E.对筛选后的候选框进行调整，以获得更精确的目标边界。

建议对预定义的锚点进行迭代回归（2016年）。
GA-RPN：抛弃了统一锚定策略，将锚点生成分为两个步骤：
1. 首先是确定可能包含物体的位置，然后在这些位置上预测锚标尺（anchor scales）：anchor中的ratio

标签

#计算机视觉 #目标检测

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。