![]() |
基于BiLSTM-CNN的英缅双语平行句对抽取方法及装置 |
![]() |
毛存礼,梁昊远,余正涛,张少宁,张亚飞,朱浩东 |
![]() |
发明专利 |
![]() |
已授权 |
![]() |
201910873805.X |
![]() |
2019-09-17 |
![]() |
2019-11-05 |
![]() |
2021-02-05 |
![]() |
本发明涉及基于BiLSTM-CNN的英缅双语平行句对抽取方法及装置,属于自然语言处理技术领域。本发明首先通过Muse工具预训练出双语词向量,然后利用缅甸语虚词和助词识别缅语的主谓宾的特点对句子进行功能标记,把每个词的句法结构信息拼接到词向量中,再使用BiLSTM?CNN对句子中进行编码,把输出概率作为衡量是否为平行句对的条件。并根据上述步骤功能模块化制成基于BiLSTM-?CNN的英缅双语平行句对抽取装置。本发明较传统的双语平行句对识别系统更为简单,实验结果表明该方法及装置在正确率和召回率等指标表现上均优于基线系统,精确率普遍都有所提升。 |