摘要:近些年文本风格迁移(Text Style Transfer,TST)任务受到了研究人员的广泛重视。现有研究使用变分自编码器、生成对抗网络等方法,先从输入文本中提取与风格属性无关的内容表示,再通过添加约束条件或结合风格嵌入向量的方式使解码器生成目标风格文本。目前的方法在情感迁移、形式迁移等任务上都取得了良好的进展,有效的提高了非平行数据集下文本风格迁移的准确度,但仍存在迁移后文本的内容和风格之间不匹配、迁移后原核心语义难以保留等问题。本文提出了一种基于流模型的文本风格迁移模型。该方法将文本进行初步编码后,提出利用神经样条流构造一系列可逆映射。通过流的正向过程将序列从原有隐状态编码空间整体映射到潜在分布,在此分布下将序列通过仿射耦合变换修改其风格特征,再将重组序列通过流模型的逆过程重新映射回初始隐状态编码空间。最后通过初始隐状态序列和重组隐状态序列联合训练解码器以生成目标文本。基于流模型所构建的转换函数为可逆函数,因此在转换隐状态时不会损失原有的分布信息,从而改善了TST任务过程中文本内容保留的问题。同时,由于训练解码器的重组隐状态序列由初始隐状态序列变化而来,故减少了TST任务迁移后内容和风格的不匹配。此外,本文还提出了新的内容保留度评价指标,同时考虑迁移准确与内容保留,综合评判模型的整体效果。在迁移任务常用数据集上的实验结果证明,本文提出的方法在保证较高的风格迁移准确率的同时,内容保留度上取得了较好的效果,在整体性能上展现了一定程度的优势。
文章目录
引言
1 相关工作
1.1文本风格迁移任务
1.2基于流的模型
2基于流的文本风格迁移模型
2.1总体框架概述
2.2基于流的内容风格重构模块
2.3训练过程
3实验与分析
3.1数据集和评估指标
3.2实验设置
3.3文本风格迁移
3.3.1自动评估
3.3.2人工评估
3.4内容保留指标
3.5可逆函数层的影响
4总结与展望