![]() |
薛振宇,余正涛*,高盛祥 |
![]() |
融入事件实体知识的汉越跨语言新闻事件检索 |
![]() |
计算机工程 |
![]() |
2022 |
![]() |
|
![]() |
|
![]() |
|
![]() |
|
现有汉越跨语言新闻事件检索方法较少使用新闻领域内的事件实体知识,在候选文档中存在多个事件的情况下,与查询句无关的事件会干扰査询句与候选文档间的匹配精度,影响检索性能。提出一种融入事件实体知识的汉越跨语言新闻事件检索模型。通过查询翻译方法将汉语事件査询句翻译为越南语事件査询句,把跨语言新闻事件检索问题转化为单语新闻事件检索问题。考虑到査询句中只有单个事件,候选文档中多个事件共存会影响查询句和文档的精准匹配,利用事件触发词划分候选文档事件范围,减小文档中与査询无关事件的干扰。在此基础上,利用知识图谱和事件触发词得到事件实体丰富的知识表示,通过查询句与文档事件范围间的交互,提取到事件实体知识表示与词以及事件实体知识表示之间的排序特征。在汉越双语新闻数据集上的实验结果表明,与BM25、ConV-KNRM、ATER等基线模型相比,该模型能够取得较好的跨语言新闻事件检索效果,NDCG和MAP指标最高可提升0.7122和0.5872。 | |
点击此处下载文章内容 |