1.PConv介绍

1.1 摘要:近年来,基于卷积神经网络(CNN)的红外小目标检测方法取得了显著的效果。然而,这些方法通常采用标准卷积,忽略了红外小目标像元分布的空间特性。因此,我们提出一种新颖的风车形卷积(PConv)来代替骨干网下层的标准卷积。PConv更好地与暗小目标的像素高斯空间分布对齐,增强了特征提取,显著增加了感受野,并且仅引入了最小的参数增加。此外,虽然最新的损失函数联合收割机尺度和位置损失,但它们没有充分考虑到这些损失在不同目标尺度上的变化的灵敏度,限制了对弱小目标的检测性能。针对这一问题,提出了一种基于尺度的动态(SD)丢失算法,该算法根据目标的大小动态调整尺度和位置丢失的影响,提高了网络对不同尺度目标的检测能力。我们构建了一个新的基准,SIRST-UAVB,它是迄今为止realshot单帧红外小目标检测中最大和最具挑战性的数据集。最后,将PConv和SD Loss融合到最新的小目标检测算法中,在IRSTD-1 K和SIRST-UAVB数据集上进行了实验,结果表明,该算法的性能得到了显著的提高,验证了该方法的有效性和可推广性。
官方论文地址:https://arxiv.org/pdf/2412.16986
1.2 简单介绍
PConv(Pinwheel-shaped Convolution)是一种为红外小目标检测量身定制的卷积模块,通过模拟红外小目标在图像中呈现的高斯型灰度分布特性,采用四个方向(上、下、左、右)扩展的非对称卷积结构,形似风车叶片,可高效提取目标中心的显著特征。该模块首先对输入特征图进行四个方向的方向性卷积操作,每个方向使用不同的非对称填充和形状卷积核,并在激活和归一化后进行通道拼接,最终通过一个2×2卷积融合输出特征图,从而显著扩大感受野,增强对目标边缘及其周围上下文信息的建模能力。PConv在保持参数量适度增长(仅比标准3×3卷积增加约111%)的同时,实现了感受野提升178%的效果,在红外小目标检测任务中可有效增强目标与背景的对比度,提升弱小目标的检测率,具备可插拔、易部署、高性能的优势。

2.代码
import torch
import torch.nn as nn
import torch.nn.functional as F
def autopad(k, p=None, d=1): # kernel, padding, dilation
"""Pad to 'same' shape outputs."""
if d > 1:
k = d * (k - 1) + 1 if isinstance(k, int) else [d * (x - 1) +

1万+

被折叠的 条评论
为什么被折叠?



