您好!欢迎访问云南省人工智能重点实验室
科研成果
当前位置:首页>科研成果>专利

专利


名称: 融合词粒度概率映射信息的汉越跨语言摘要方法 
作者: 张亚飞,李笑萌,郭军军,高盛祥,余正涛  
类型: 发明专利  
状态: 已授权  
专利号/登记号: 202110958255.9  
申请日/受理日: 2021-08-20 
公告日: 2021-12-03 
授权日: 2023-10-17 
简介: 本发明涉及融合词粒度概率映射信息的汉越跨语言摘要方法,属于自然语言处理技术领域。本发明包括步骤:语料收集;对收集的语料进行分词预处理;并利用fast?align工具及统计的思想获得汉越概率映射对;并采用编解码注意力机制,以此获取基于汉语文章摘要的关键词;概率映射机制的构建;词级概率映射信息的融入;本发明对汉越词粒度的信息和其篇章级的文本进行表征;其次,基于注意力机制对词粒度的信息和篇章级文本进行联合表征;最后,通过融合词粒度的对齐信息到目标语言的摘要,提高摘要的准确性。本发明在汉?越跨语言摘要数据集上进行了实验,实验证明了本发明的有效性和优越性。