![]() |
融合词粒度概率映射信息的汉越跨语言摘要方法 |
![]() |
张亚飞,李笑萌,郭军军,高盛祥,余正涛 |
![]() |
发明专利 |
![]() |
已授权 |
![]() |
202110958255.9 |
![]() |
2021-08-20 |
![]() |
2021-12-03 |
![]() |
2023-10-17 |
![]() |
本发明涉及融合词粒度概率映射信息的汉越跨语言摘要方法,属于自然语言处理技术领域。本发明包括步骤:语料收集;对收集的语料进行分词预处理;并利用fast?align工具及统计的思想获得汉越概率映射对;并采用编解码注意力机制,以此获取基于汉语文章摘要的关键词;概率映射机制的构建;词级概率映射信息的融入;本发明对汉越词粒度的信息和其篇章级的文本进行表征;其次,基于注意力机制对词粒度的信息和篇章级文本进行联合表征;最后,通过融合词粒度的对齐信息到目标语言的摘要,提高摘要的准确性。本发明在汉?越跨语言摘要数据集上进行了实验,实验证明了本发明的有效性和优越性。 |