YOLOv12改进 | 卷积篇 | YOLOv12引入AAAI2025为红外小目标检测的风车形卷积——PConv(Pinwheel-shaped Convolution)

1.PConv介绍

1.1 摘要:近年来,基于卷积神经网络(CNN)的红外小目标检测方法取得了显著的效果。然而,这些方法通常采用标准卷积,忽略了红外小目标像元分布的空间特性。因此,我们提出一种新颖的风车形卷积(PConv)来代替骨干网下层的标准卷积。PConv更好地与暗小目标的像素高斯空间分布对齐,增强了特征提取,显著增加了感受野,并且仅引入了最小的参数增加。此外,虽然最新的损失函数联合收割机尺度和位置损失,但它们没有充分考虑到这些损失在不同目标尺度上的变化的灵敏度,限制了对弱小目标的检测性能。针对这一问题,提出了一种基于尺度的动态(SD)丢失算法,该算法根据目标的大小动态调整尺度和位置丢失的影响,提高了网络对不同尺度目标的检测能力。我们构建了一个新的基准,SIRST-UAVB,它是迄今为止realshot单帧红外小目标检测中最大和最具挑战性的数据集。最后,将PConv和SD Loss融合到最新的小目标检测算法中,在IRSTD-1 K和SIRST-UAVB数据集上进行了实验,结果表明,该算法的性能得到了显著的提高,验证了该方法的有效性和可推广性。

官方论文地址:https://arxiv.org/pdf/2412.16986

1.2 简单介绍

  PConv(Pinwheel-shaped Convolution)是一种为红外小目标检测量身定制的卷积模块,通过模拟红外小目标在图像中呈现的高斯型灰度分布特性,采用四个方向(上、下、左、右)扩展的非对称卷积结构,形似风车叶片,可高效提取目标中心的显著特征。该模块首先对输入特征图进行四个方向的方向性卷积操作,每个方向使用不同的非对称填充和形状卷积核,并在激活和归一化后进行通道拼接,最终通过一个2×2卷积融合输出特征图,从而显著扩大感受野,增强对目标边缘及其周围上下文信息的建模能力。PConv在保持参数量适度增长(仅比标准3×3卷积增加约111%)的同时,实现了感受野提升178%的效果,在红外小目标检测任务中可有效增强目标与背景的对比度,提升弱小目标的检测率,具备可插拔、易部署、高性能的优势。

2.代码

import torch
import torch.nn as nn
import torch.nn.functional as F


def autopad(k, p=None, d=1):  # kernel, padding, dilation
    """Pad to 'same' shape outputs."""
    if d > 1:
        k = d * (k - 1) + 1 if isinstance(k, int) else [d * (x - 1) +
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值