摘要:围绕如何在复杂的场景中充分利用图像语义分割得到目标的语义信息,并对目标跟踪器的输出进行尺度优化,设计了基于注意力机制优化的图像语义分割网络。针对目标跟踪器的输出和特征输入两个方面进行优化,该网络可以实现对各类算法的即插即用。利用图像语义分割掩码获得目标的旋转框边界,根据目标的旋转框和非旋转框边界对目标输入阶段的特征进行去噪优化,减弱背景噪声对跟踪器的判别影响。分别从网络的结构、训练、目标旋转框标定以及对跟踪器的输入特征进行去噪等方面进行讨论。在公开数据集上OTB100,VOT2016和VOT2018上进行实验,对比验证了目标运动模型在解决目标跟踪过程中,目标尺度优化的准确性和鲁棒性。
文章目录
1 相关工作
2 本文方法
2.1 基于注意力机制的图像语义分割模型
2.1.1 上采样优化模块
2.1.2 特征修正网络模块
2.1.3 计算复杂度分析
2.2 基于图像语义分割优化目标尺度
2.2.1 目标矩形尺度的标定
2.2.2基于图像语义信息对目标进行背景去噪
3 实验结果与分析
3.1 OTB100数据集上的实验对比
3.2 VOT2016和VOT2018数据集上的实验对比
3.3 计算复杂度对比分析
4 结 论