摘要:近年来,图神经网络广泛应用于跨域自然语言生成SQL语句的编码器。基于图神经网络的编码过程通过捕获数据库架构和自然语言问题之间的关联信息,大幅提高生成模型在跨域SQL语句生成下的泛化性。现有的图神经网络方法在异构图结构编码学习过程中存在缺陷,以节点为中心进行数据库架构和自然语言问题的链接预测,在复杂语义场景下容易出现错配。针对这一问题,提出了一种面向跨域自然语言生成SQL语句的异构图学习框架。框架针对异构图以边为中心学习的过程提出关系边子图构建和边超图注意力网络,有效学习异构图中关系边与节点的差异化结构特征,实现复杂语义场景下SQL语句正确生成。为验证提出框架的有效性,在多个跨域自然语言生成SQL语句数据集进行充分实验对比。结果表明,相较于目前的图神经网络基准算法,框架在F1和EM两个指标上均取得显著提升,且在复杂跨域场景下具有更强的泛化性。
文章目录
0 概述
1 相关工作
2 模型
2.1 图输入
2.2 子图构建
2.3 编码结构信息
2.4 聚合结构信息
3 实验与结果分析
3.1 数据集描述
3.2 对比方法
3.3 评价指标
3.4 结果分析
3.5 复杂度分析
3.6 消融实验
4 结语