摘要:实体链接旨在将自然语言文本中的提及链接到知识库中相应的目标实体,主要面临提及和候选实体的表征能力有限,导致候选实体精确排序困难的问题,而现有的知识库扩展和图嵌入等提高表征能力的方法依赖外部数据或知识,限制了其应用。本文提出了一种实体链接中提及和候选实体精确排序的方法,通过结合提及上下文构建prompt问句,将提及和候选实体相似度计算转化为基于prompt问句的打分模式。通过预训练模型微调打分 器,得到提及和候选实体相似度的打分,并综合候选实体发现阶段的得分,以筛选出更准确的目标实体。这一过程无需额外的知识,能够融合上下文信息,从而更准确地衡量提及和实体之间的相似度。在两个公共数据集上将本文模型与基线模型进行了实验比较,相比次优模型,本文模型acc@1值分别提升了0.88%和0.41%。
文章目录
0 概述
1 相关工作
2模型方法
2.1 问题定义
2.2 本文模型
2.2.1 基于稀疏和稠密表征的候选实体发现
2.2.2 基于Prompt分类的候选实体打分
2.2.3 两阶段分数加权
3 实验设置
3.1 数据集
3.2 评价指标
3.3 数据预处理
3.4 模型设置
3.5 基线模型
4 结果与分析
4.1 与基线模型的比较
4.2 消融分析
4.3 两阶段分数加权分析
4.4 两阶段打分实例
4.5 实例分析
5 结束语