![]() |
基于词对齐的半监督对抗学习跨语言摘要生成方法 |
![]() |
余正涛,张莹,黄于欣,高盛祥,郭军军,相艳 |
![]() |
发明专利 |
![]() |
已授权 |
![]() |
202011408948.2 |
![]() |
2020-12-03 |
![]() |
2021-03-23 |
![]() |
2022-06-14 |
![]() |
本发明涉及基于词对齐的半监督对抗学习跨语言摘要生成方法,属于自然语言处理技术领域。本发明包括步骤:收集用于训练汉越跨语言摘要生成的新闻文本,以及获取已有的汉越双语词向量;利用汉越新闻文本和汉越双语词向量分别进行单语摘要模型和半监督对抗学习的预训练;利用Bert编码器分别对输入的汉越伪平行语料进行向量表征;利用编码器获得的向量结合汉越双语种子词典进行半监督对抗学习,获取映射到同一语义空间的向量;把映射在同一语义空间下的上下文文本向量和参考摘要作为transformer解码器的输入,解码输出目标语言摘要。本发明实现了跨语言摘要生成任务,优化了跨语言摘要的效果。 |