您好!欢迎访问云南省人工智能重点实验室
科研成果
当前位置:首页>科研成果>专利

专利


名称: 基于枢轴的汉越联合训练神经机器翻译方法 
作者: 高盛祥,张磊,余正涛,王振晗,朱俊国,刘畅  
类型: 发明专利  
状态: 已授权  
专利号/登记号: 202011020199.6 
申请日/受理日: 2020-09-25 
公告日: 2021-01-22 
授权日: 2022-06-21 
简介: 本发明涉及基于枢轴的汉越联合训练神经机器翻译方法,属于自然语言处理技术领域。本发明包括步骤:所述方法首先利用汉越平行语料训练翻译模型得到汉语和越南语的词向量表征;其次以英语作为枢轴语言对汉语?英语,英语?越南语翻译模型进行联合训练,再将汉语?英语、英语?越南语翻译模型的汉语、越南语的向量表示与汉越模型得到的汉语、越南语的向量表示计算优化从而进行汉越联合训练。本发明将汉越平行语料与汉英,英越平行语料结合起来进行联合训练,充分利用了英语枢轴语料提升了汉越机器翻译性能,从而解决了汉越平行语料缺失导致翻译模型性能不佳的问题。