YOLOv12改进 | 卷积篇 | YOLOv12引入AAAI2025为红外小目标检测的风车形卷积——PConv（Pinwheel-shaped Convolution）

原创

已于 2025-04-18 15:15:49 修改 · 2k 阅读

于 2025-03-31 18:33:59 首次发布

1.PConv介绍

1.1 摘要：近年来，基于卷积神经网络（CNN）的红外小目标检测方法取得了显著的效果。然而，这些方法通常采用标准卷积，忽略了红外小目标像元分布的空间特性。因此，我们提出一种新颖的风车形卷积（PConv）来代替骨干网下层的标准卷积。PConv更好地与暗小目标的像素高斯空间分布对齐，增强了特征提取，显著增加了感受野，并且仅引入了最小的参数增加。此外，虽然最新的损失函数联合收割机尺度和位置损失，但它们没有充分考虑到这些损失在不同目标尺度上的变化的灵敏度，限制了对弱小目标的检测性能。针对这一问题，提出了一种基于尺度的动态（SD）丢失算法，该算法根据目标的大小动态调整尺度和位置丢失的影响，提高了网络对不同尺度目标的检测能力。我们构建了一个新的基准，SIRST-UAVB，它是迄今为止realshot单帧红外小目标检测中最大和最具挑战性的数据集。最后，将PConv和SD Loss融合到最新的小目标检测算法中，在IRSTD-1 K和SIRST-UAVB数据集上进行了实验，结果表明，该算法的性能得到了显著的提高，验证了该方法的有效性和可推广性。

官方论文地址：https://arxiv.org/pdf/2412.16986

1.2 简单介绍

PConv（Pinwheel-shaped Convolution）是一种为红外小目标检测量身定制的卷积模块，通过模拟红外小目标在图像中呈现的高斯型灰度分布特性，采用四个方向（上、下、左、右）扩展的非对称卷积结构，形似风车叶片，可高效提取目标中心的显著特征。该模块首先对输入特征图进行四个方向的方向性卷积操作，每个方向使用不同的非对称填充和形状卷积核，并在激活和归一化后进行通道拼接，最终通过一个2×2卷积融合输出特征图，从而显著扩大感受野，增强对目标边缘及其周围上下文信息的建模能力。PConv在保持参数量适度增长（仅比标准3×3卷积增加约111%）的同时，实现了感受野提升178%的效果，在红外小目标检测任务中可有效增强目标与背景的对比度，提升弱小目标的检测率，具备可插拔、易部署、高性能的优势。

2.代码

import torch
import torch.nn as nn
import torch.nn.functional as F


def autopad(k, p=None, d=1):  # kernel, padding, dilation
    """Pad to 'same' shape outputs."""
    if d > 1:
        k = d * (k - 1) + 1 if isinstance(k, int) else [d * (x - 1) +

标签