您好!欢迎访问云南省人工智能重点实验室
科研成果
当前位置:首页>科研成果>专利

专利


名称: 融合EMD最小化双语词典的汉-越无监督神经机器翻译方法 
作者: 余正涛,薛明亚,高盛祥,赖华,翟家欣,朱恩昌,陈玮 
类型: 发明专利  
状态: 已授权  
专利号/登记号: 202010096013.9 
申请日/受理日: 2020-02-17 
公告日: 2020-10-09 
授权日: 2022-12-20 
简介: 本发明涉及融合EMD最小化双语词典的汉?越无监督神经机器翻译方法,属于机器翻译技术领域。本发明包括步骤:语料收集;使用网络爬虫爬取汉语和越南语单语句子;首先分别训练汉语和越南语的单语词嵌入,通过最小化词嵌入分布的EMD训练得到汉越双语词典;再将该词典作为种子词典训练得到汉越双语词嵌入;最后再将双语词嵌入应用到共享编码器的无监督机器翻译模型中构建融合EMD最小化双语词典的汉?越无监督神经机器翻译方法。本发明方法能够有效提升汉越无监督神经机器翻译的性能。