摘要:针对构建领域问答系统时所面临的数据成本高、知识构建复杂和不同领域数据集差异大等挑战,提出了一种融合大语言模型和领域知识的问答系统构建方法。现有方法多是直接将本地知识语料分段存储匹配,在进行检索增强生成时,查询文本与分段内容语义匹配度不高,从而降低文本生成质量。为此,提出基于提示工程的查询语义对齐优化方法,通过生成“假设性问答对”来统一用户查询和语料的语义空间,从而提高领域知识的检索效率和答案的准确性。此外,实验证明,所提方法能够克服模型训练成本高的问题,迅速构建部署到不同垂直领域,并在性能上优于其他方法。
文章目录
1 问答系统框架
1.1 领域知识自动抽取
1.2 对齐优化方法
1.3 向量知识库构建
1.4 问题检索与答案生成
2 实验设置
2.1 实验环境
2.2 数据集
2.3 评价指标
2.4 基准方法
3 实验及结果分析
3.1 知识向量召回数量选择
3.2 问答系统构建时间
3.3 问答系统回答性能
3.4 消融实验
3.5 基座语言模型影响分析
3.6 实例分析
4 结束语