摘要:在图像模式识别应用中,针对布局估计任务后处理步骤繁琐、生成算法耗时等问题,基于相机成像原理设计了一种快速的布局生成算法,利用图Transformer节点与邻边信息融合的特性,将复杂耗时的后处理步骤转换为平面与线段特征的交叉计算过程。使用Structured3D数据集对整体算法进行测试,结果表明各项评价指标均取得提升,单张图片计算耗时达到87 ms,整体推理速度与主流方法相比提升20%。布局生成算法耗时由单张图片66.31 ms下降至3.18 ms,速度提升了95.21%。
文章目录
1 基于图Transformer的快速布局估计算法
1.1 FastLayout网络框架
1.2 特征编码器
1.3 二维位置编码
1.4 逆栅格化布局生成算法
2 实验结果与分析
2.1 数据集及环境配置
2.2 评价指标
2.3 对比实验
2.4 消融实验
2.5 模型限制与改进讨论
3 结论