您好!欢迎访问云南省人工智能重点实验室
科研成果
当前位置:首页>科研成果>论文列表

论文列表



 论   文  作   者: 冯雄波,黄于欣,赖华*,高玉梦
 论   文  名   称: 基于多策略强化学习的低资源跨语言摘要方法研究
 论文发表刊物: 中文信息学报(2017)
 论文发表时间: 2023
 卷   号  页   码:
 论   文  描   述:
 收   录  情   况:
  论   文  摘   要:
        跨语言摘要(CLS)旨在给定一个源语言文件(如越南语),生成目标语言(如中文)的摘要。最近,端到端的 CLS模型在大规模、高质量的标记数据基础上取得了相当良好的性能,这些标记数据通常是利用机器翻译模型将单语摘要语料库翻译成 CLS语料库而构建的。然而,由于低资源语言翻译模型的性能受限,翻译噪音会被引入到 CLS语料库中,这严重损害了 CLS的模型性能。因此,提出利用多策略强化学习来解决低资源噪声训练数据场景下的 CLS模型训练问题,引入源语言摘要作为额外的监督信号来缓解翻译后的噪声目标摘要影响。具体来说,首先通过计算源语言摘要和生成目标语言摘要之间的单词相关性和单词缺失程度来学习强化奖励,然后在交叉熵损失和强化奖励的约束下优化 CLS模型。为验证所提出模型的性能,构建了一个有噪声的汉越 CLS 语料库,根据实验结果在汉语-越南语跨语言摘要数据集和越南语-汉语跨语言摘要数据集上,所提出的模型 ROUGE分数明显优于其他基线模型,相比 NCLS基线模型,该模型RG-1分别提升了0.71和 0.84个点,提出的方法能够有效弱化噪声干扰,提高生成摘要的质量。
点击此处下载文章内容