您好!欢迎访问云南省人工智能重点实验室
科研成果
当前位置:首页>科研成果>专利

专利


名称: 基于融合词性和位置信息的汉-越卷积神经机器翻译方法 
作者: 余正涛、王文君、王振晗、高盛祥、何建雅琳、陈玮、黄于欣 
类型: 发明专利  
状态: 已授权  
专利号/登记号: 201910613122.0 
申请日/受理日: 2019-07-19 
公告日: 2020-08-28 
授权日: 2020-08-28 
简介: 本发明涉及融合句法解析树的汉?越神经机器翻译方法,属于自然语言处理技术领域。本发明能够实现汉语?越南语、越南语?汉语的机器翻译。通过从互联网爬取和人工翻译的方式构建的汉语?越南语双语平行语料作为训练数据集。为解决目前汉?越机器翻译中由于训练语料不足导致的翻译错误;本发明首先对源语言进行分词、词性标记以及句法解析,得到源语言的句法树。然后将句法标签向量化并融合到机器翻译模型训练的编码过程,训练机器翻译模型。所得模型可以有效完成汉语和越南语之间的翻译。实验结果表明,相比未融合句法解析树的基准系统该方法得到的译文更加流畅,并获得了0.6个BLEU值的提升。