ESANet: 高效的RGB-D语义分割网络用于室内场景分析

ESANet简介

ESANet (Efficient Scene Analysis Network)是由德国伊尔默瑙工业大学的研究人员开发的一个高效的RGB-D语义分割网络。它的主要目标是在保证分割精度的同时,实现实时的推理速度,使其能够应用于移动机器人等资源受限的场景中。

ESANet的设计理念是:通过精心设计的网络架构,在RGB-D数据上实现比单纯使用RGB图像更好的分割效果,同时保证在嵌入式设备上的实时性能。研究人员在论文中展示了ESANet在NYUv2、SUNRGB-D等常用室内数据集上达到了当前最好的性能,同时在NVIDIA Jetson AGX Xavier上能够达到近30FPS的帧率。

ESANet architecture

网络架构

ESANet的网络架构主要包含以下几个部分:

  1. 编码器:使用ResNet34作为骨干网络,采用Non-Bottleneck-1D (NBt1D)结构。

  2. 解码器:采用3个解码块,通道数递减。

  3. 上下文模块:使用金字塔池化模块(PPM)捕获多尺度上下文信息。

  4. RGB-D融合:在编码器中使用SE-add模块融合RGB和深度信息。

  5. 上采样:采用可学习的3x3卷积+零填充进行上采样。

这种精心设计的架构能够在保

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值