您好!欢迎访问云南省人工智能重点实验室
科研成果
当前位置:首页>科研成果>论文列表

论文列表



 论   文  作   者: 余正涛,高盛祥
 论   文  名   称: 基于维基百科的汉越词语相似度计算
 论文发表刊物: 南京理工大学学报. 自然科学版
 论文发表时间: 2016
 卷   号  页   码: 2016,40(04):461-466.
 论   文  描   述: 中文核心
 收   录  情   况: EI Indexed  
  论   文  摘   要:
        为了解决跨语言汉越词语相似度计算问题,以维基百科多语言概念页面作为桥梁,利用概念之间存在的翻译对应关系、词语出现在不同概念页面及与其他概念之间存在共现关系,提出了基于维基百科的汉越词语相似度计算方法,该方法首先提取维基百科中汉语越南语具有对应关系的概念集合,构建双语概念特征空间,然后根据词语在相应概念描述文本中出现的词频特征,以及词语与概念在其他概念文本中的共现特征构建词语的概念向量值,最后通过夹角余弦对两个向量进行词语相似度计算。实验结果表明提出的方法在汉越双语词语相似度计算上表现了好的效果,概念共现关系能够提高词语相似度的准确率。关键词: 汉语;越南语;词语相似度;维基百科;概念;共现关系;对应关系;词频;
点击此处下载文章内容