摘要:单目图像缺乏空间深度信息,导致单目3D目标检测任务存在深度模糊性。现有处理2D图像的注意力机制无法解决深度模糊性问题,且计算量大,难以部署在车载移动设备上。针对这些问题,本文提出一种基于3D注意力机制和多目标边框策略的单目3D目标检测算法。考虑到2D至3D映射的深度模糊性,首先在网络设计上融入了3D注意力机制,其中包含深度信息增强核心和低计算复杂度的位置增强核心。其次,通过对深度标签进行扰动,多目标边框策略采用伪标签来缓解原有硬标签的严格限制。因此,深度估计的精准性有所提升,增强了模型的3D空间感知能力以及泛化性能,进而使其适用于3D目标检测任务。在nuScenes数据集上的实验表明,该算法优于当前的单目3D目标检测算法。最后,通过TensorRT工具进行模型转换及半精度加速,实现了在车载移动设备上的部署。在AGX Xavier与Jetson Orin NX嵌入式平台上,推理时间每帧分别为67 ms和89 ms,可实时精确检测3D目标。
文章目录
1网络设计
1.1 网络整体设计
1.2 多目标边框策略
1.3 模型部署
2实验
2.1 实验准备
2.1.1 数据集
2.1.2 实验平台
2.1.3 评估指标
2.2 性能比较
3 讨论
4 结论