首页 > 文档 > 学术/知识/论文 > IT/计算机/信息技术 > 计算机软件及计算机应用

面向深度模糊的可部署单目3D目标检测方法

2025-04-08 160 1.17M 0

　　摘要：单目图像缺乏空间深度信息，导致单目3D目标检测任务存在深度模糊性。现有处理2D图像的注意力机制无法解决深度模糊性问题，且计算量大，难以部署在车载移动设备上。针对这些问题，本文提出一种基于3D注意力机制和多目标边框策略的单目3D目标检测算法。考虑到2D至3D映射的深度模糊性，首先在网络设计上融入了3D注意力机制，其中包含深度信息增强核心和低计算复杂度的位置增强核心。其次，通过对深度标签进行扰动，多目标边框策略采用伪标签来缓解原有硬标签的严格限制。因此，深度估计的精准性有所提升，增强了模型的3D空间感知能力以及泛化性能，进而使其适用于3D目标检测任务。在nuScenes数据集上的实验表明，该算法优于当前的单目3D目标检测算法。最后，通过TensorRT工具进行模型转换及半精度加速，实现了在车载移动设备上的部署。在AGX Xavier与Jetson Orin NX嵌入式平台上，推理时间每帧分别为67 ms和89 ms，可实时精确检测3D目标。

　　文章目录

　　1网络设计

　　1.1 网络整体设计

　　1.2 多目标边框策略

　　1.3 模型部署

　　2实验

　　2.1 实验准备

　　2.1.1 数据集

　　2.1.2 实验平台

　　2.1.3 评估指标

　　2.2 性能比较

　　3 讨论

　　4 结论

您还没有登录，请登录后查看详情

注意力机制模型部署深度模糊性单目3D目标检测

下一篇：基于窄馏分分子结构的重油分子聚集行为介观尺度模拟研究
上一篇：基于体检队列的代谢相关脂肪性肝病与高血糖关联研究及联合预测模型构建研究

点赞 0举报收藏 0打赏 0评论 0

久存网超级..
加关注2
~~没有留下签名~~~~

本类推荐

	融合风格编码的双通道生成对抗网络步态识别
	大语言模型驱动下知识图谱的构建及应用综述
	面向点击率预估的会话动态兴趣深度推演网络
	一种视/触觉融合的柔性物体抓取力估计方法
	一种自适应融合多模态特征的6D物体位姿估计方法
	模型驱动反卷积网络用于大视场光片图像恢复
	“AIGC+”:虚拟现实媒介内容生产机制研究
	开源软件开发者价值评估体系及其实证研究
	融合上下文引导代价体和深度细化的多视图立体重建
	颗粒图像的颜色校准与表征

下载排行