摘要:针对水下图像质量差、目标多尺度和严重遮挡导致的漏检和误检等问题,提出一种结合目标信息增强与语义-位置路径聚合的水下目标检测模型。该模型以RT-DETR框架为基础,提出了边缘特征多尺度注入模块(Multi-Scale Injection for Edge Features Module,MSI-Edge),将边缘信息注入深层网络中,强化了模型对小目标的感知能力;同时,提出了全局-局部特征增强模块(Global-Local Feature Enhancement Module,GLF-Enhance)来替代编码器中的传统多头自注意力机制,增强对目标全局和局部信息的学习能力,并加速模型推理;进而,设计了一种新的结合语义-位置路径聚合网络(Semantic-Location Path Aggregation Network,SL-PAN),利用高层特征作为权重来指导低层特征中的语义信息学习,再使用低层特征作为权重来指导高层特征中的位置信息学习,从而有效缓解多尺度特征融合过程中信息传递退化的问题。在公开水下数据集上进行实验验证,相较基准模型RT-DETR(ResNet50主干网络),在URPC数据集上AP、AP50、AP75指标分别提升了约3.2%、3.0%和2.7%;在DUO数据集上分别提升了2.9%、2.7%、3.0%,同时有效降低了误检和漏检率。消融实验验证了各模块的有效性。整体性能与主流目标检测器及最新水下目标检测器相比,达到了较好水平。
文章目录
1相关工作
1.1 水下目标检测方法
1.2 DETR目标检测器
2本文方法
2.1模型概述
2.2边缘特征多尺度注入模块
2.3全局-局部特征增强
2.4语义-位置路径聚合网络
3实验
3.1实验环境设置
3.2数据集及评价指标
3.3对比实验结果与分析
3.4误检与漏检性能分析
3.5边缘特征注入模块的性能分析
3.6全局-局部特征增强的性能分析
3.7 SL-PAN网络的性能分析
3.8各模块消融实验
4结论