摘要:针对基于4D代价体金字塔的立体匹配网络存在多尺度信息利用率低,从多代价体中提取关键信息困难等不足,提出一种多尺度信息引导代价体金字塔聚合的立体匹配网络.为有效利用代价体金字塔聚合过程中不同尺度的输出信息,设计一种基于单峰视差注意力的尺度间聚合方式,通过代价体金字塔上部分的预测视差突出金字塔底层代价体中的重点信息;为增强代价聚合对于显著特征的关注,提出引导沙漏结构,通过图像的多尺度几何信息与代价体的全局空间信息,自适应地聚合与校准各尺度代价体.实验结果表明,该网络在SceneFlow、KITTI 2012和KITTI 2015数据集上取得良好匹配准确度的同时具有较快推理速度,且与CFNet和PCWNet相比参数量分别降低31%与57%.
文章目录
0 引言
1 MSGNet网络结构
1.1 多尺度特征提取
1.2 代价体金字塔构建
1.3 代价体金字塔聚合
1.3.1 基于单峰视差注意力的尺度间聚合方式
1.3.2 引导沙漏结构
1.4 视差回归与损失函数
2 实验结果与分析
2.1 数据集与评价指标
2.2 实验环境与训练策略
2.3 超参数分析
2.4 消融实验结果与分析
2.5 与其他立体匹配网络性能对比与分析
2.5.1 SceneFlow测试集对比实验结果
2.5.2 KITTI测试集对比实验结果
2.5.3 网络综合性能对比
3 结论