![]() |
基于双语词典映射指导的跨语言信息检索方法 |
![]() |
余正涛,李岩,郭军军,线岩团,黄于欣,相艳 |
![]() |
发明专利 |
![]() |
已授权 |
![]() |
202110344892.7 |
![]() |
2021-03-30 |
![]() |
2021-07-06 |
![]() |
2022-07-29 |
![]() |
本发明涉及基于双语词典映射指导的跨语言信息检索方法。包括:构建并预处理汉越CLIR数据集;预处理英法、英菲、英斯三种CLIR公共数据集;构建的双语映射词典并基于词级映射分别构造查询辅助句;利用共享Transformer分别获取查询、辅助句及文档的上下文表示,同时借助查询与辅助句之间的双语交互注意力机制获得查询的跨语言特征表示;最后利用双语交互排序模型获得查询和文档的匹配分数实现跨语言信息检索。本发明利用双语映射词典实现跨语言沟通,缓解了缺乏查询?文档对齐语料及语言差异性给信息检索带来的影响。本发明相比跨语言信息检索主流方法,MAP指标明显提升。且本方法在差异性不同的语言对上都具有明显的优势。 |