基于改进DETR的齿轮表面缺陷检测系统设计与实现

原创于 2026-07-02 09:06:42 发布 · 153 阅读

本内容遵循CC 4.0 BY-SA版权协议

1. 项目背景与核心价值

齿轮作为工业传动系统的核心部件，其表面质量直接影响设备寿命和运行安全。传统人工检测方式存在效率低、漏检率高的问题，而基于深度学习的视觉检测技术正逐步成为工业质检的新标准。我们团队基于改进DETR算法开发的齿轮表面缺陷识别系统，在保持实时性的同时将检测精度提升至82.4%，较传统方法提升近30个百分点。

这套系统包含三个创新点：首先采用重参数化卷积改进的特征提取网络，在NEU-DET数据集上测试显示，对微小划痕（<0.5mm）的识别率提升17.6%；其次设计的多尺度特征金字塔结构，使跨尺寸齿轮的检测稳定性提升至89.7%；最后引入的注意力机制改进方案，在强反光场景下的误报率降低至3.2%。整套方案已部署在某变速箱制造企业的产线，实现每分钟60件的高速检测。

2. 技术架构解析

2.1 改进DETR算法设计

传统DETR算法在工业检测中存在两个痛点：一是计算复杂度高导致推理速度慢，二是对小目标检测效果欠佳。我们的改进方案包含以下关键技术点：

骨干网络优化 ：

采用FasterNet-Tiny作为基础架构，其PConv层经过重参数化改进
在保持83.6%原精度前提下，参数量减少42%（从18.7M降至10.8M）
实测推理速度提升至112FPS（RTX3060显卡）

多尺度特征融合 ：

class DMSFPN(nn.Module):
    def __init__(self, in_channels=[64,128,256]):
        super().__init__()
        self.mscb = MSCB(in_channels)  # 多尺度卷积块
        self.eucb = EUCB(scale_factor=2)  # 高效上采样模块
        
    def forward(self, features):
        # 特征图尺寸示例：[bs,64,160,160]、[bs,128,80,80]、[bs,256,40,40]
        fused = []
        for i in range(len(features)):
            x = self.mscb(features[i])
            if i > 0:
                x = self.eucb(x) + features[i]
            fused.append(x)
        return torch.cat(fused, dim=1)

注意力机制改进 ：

将原始Transformer中的自注意力替换为TSSA模块
内存占用降低63%（从4.2GB降至1.5GB）
在强噪声环境下的mAP保持率提升至91.3%

2.2 数据集构建与增强

我们收集了包含6类常见缺陷的齿轮数据集：

总样本量：12,847张（训练集9,592张，测试集3,255张）
缺陷类型：划痕（32%）、凹坑（24%）、锈蚀（18%）、缺损（12%）、毛刺（9%）、其他（5%）

数据增强策略：

transform = A.Compose([
    A.RandomGamma(gamma_limit=(80,120), p=0.5),
    A.GaussNoise(var_limit=(10,50), p=0.3),
    A.RandomShadow(num_shadows=2, p=0.2),
    A.CoarseDropout(max_holes=8, p=0.4),
    A.RandomBrightnessContrast(p=0.5),
], bbox_params=A.BboxParams(format='pascal_voc'))

3. 系统实现细节

3.1 训练配置

硬件环境 ：

GPU：NVIDIA RTX 3090×2
内存：128GB DDR4
存储：2TB NVMe SSD

超参数设置 ：

training:
  batch_size: 32
  epochs: 150
  optimizer: AdamW
  lr: 1e-4
  weight_decay: 1e-4
  lr_scheduler: CosineAnnealingLR
  warmup_epochs: 10

model:
  backbone: FasterNet-Tiny
  neck: DMSFPN
  head: TSSA-DETR
  num_queries: 100

关键训练技巧 ：

采用渐进式分辨率训练（160→320→640）
引入课程学习策略，先训练简单样本
使用EMA（指数移动平均）模型保存

3.2 部署方案

工业现场部署采用TensorRT加速：

模型转换流程：

trtexec --onnx=model.onnx \
        --saveEngine=model.engine \
        --fp16 \
        --workspace=4096 \
        --builderOptimizationLevel=3

性能对比： | 方案 | 推理时延(ms) | 显存占用(MB) | 吞吐量(FPS) | |------|-------------|-------------|------------| | 原始PyTorch | 28.6 | 2834 | 34.9 | | TensorRT-FP32 | 15.2 | 1872 | 65.8 | | TensorRT-FP16 | 9.7 | 1265 | 103.1 |