摘要:跨领域命名实体识别在现实应用中,尤其在目标领域数据稀缺的小样本场景中具有重要价值。然而,现有方法主要是通过特征表示或模型参数共享实现的跨领域实体能力迁移,未充分考虑由于样本选择偏差而引起的虚假相关性问题。为了解决跨领域中的虚假相关性问题,提出一种因果关系表示增强的跨领域命名实体识别模型,首先将源域的语义特征表示与目标域的语义特征表示进行融合,生成一种增强的上下文语义特征表示。然后,通过结构因果模型捕捉增强后的特征变量与标签之间的因果关系。最后,在目标域中应用因果干预和反事实推断策略,提取存在的直接因果效应,从而进一步缓解特征与标签之间的虚假相关性问题。该方法在公共数据集上进行了实验,实验结果得到了显著提高。
文章目录
1 相关工作
2问题定义
3 本文方法
3.1 模型架构
3.2 语义特征融合
3.3 因果表示学习
3.4 干预和反事实表示
3.5 目标优化
4 实验
4.1 实验数据
4.2 实验设置
4.3 对比模型
4.4 评测指标
4.5 实验结果
4.6 实验分析
4.6.1 消融实验
4.6.2 参数分析
4.6.3 案例分析
4.7 扩展实验
4.7.1大模型分析
4.7.2因果关系分析
4.7.3模型性能分析
5 结束语