摘要:多目标跟踪是计算机视觉领域中一个重要的研究课题,旨在定位和识别给定视频中的所有运动目标。已有的匹配算法对于所有候选目标考虑相同的重要性(DeepSORT)或者二值化重要性(ByteTrack),导致高置信度的准确目标被低置信度的错误目标轨迹挤占,从而带来更多的误匹配。针对于以上问题,我们提出了基于自适应混合相似度的多目标匹配算法,通过对不同置信度的候选目标赋予不同的权重来提升目标匹配的可靠性。自适应混合相似度主要考虑以下三方面因素: 1) 高检测得分表示候选目标框的视觉辨别性高和空间遮挡较少,因此应该具有更高的权重; 2) 低检测得分意味着这个候选目标视觉特征弱并且可能被遮挡,在匹配时应该赋予较低的权重; 3) 对于中间的候选目标通过线性权重来控制不同目标的匹配重要性。相比于传统的多目标匹配算法,我们提出的自适应混合相似度算法可以有效提升多目标匹配的准确性,在MOT17和MOT20数据集上验证了算法的有效性,例如, 相比于最先进的技术(state of the art, SOTA)的ByteTrack,多目标跟踪准确度(multiple object tracking accuracy, MOTA)在MOT17/MOT20上分别从76.6%/74.6%提升到77.5%/75.4%.
文章目录
1相关工作
1.1 相似性度量
1.2 匹配策略
2基于自适应混合相似度的多目标匹配
2.1 多目标匹配框架
2.2 自适应混合相似度
2.3 自适应混合相似度多目标跟踪
3实验
3.1 参数设置
3.2 实验结果与分析
3.3 消融实验
3.4 可视化
4结论