![]() |
一种融合词向量和主题模型的领域实体消歧方法 |
![]() |
余正涛,马晓军,郭剑毅,陈玮,张志坤 |
![]() |
发明专利 |
![]() |
已授权 |
![]() |
201710913216.0 |
![]() |
2017-09-30 |
![]() |
2018-03-30 |
![]() |
2021-05-14 |
![]() |
本发明涉及一种融合词向量和主题模型的领域实体消歧方法,属于自然语言处理和深度学习技术领域。本发明获取待消歧实体的候选实体集合,再获取待消歧实体和候选实体的向量形式,结合上下位关系领域知识库获取待消歧实体的类别指称,进行上下文相似度和类别指称相似度计算,再利用LDA主题模型和Skip?gram词向量模型对不同主题分类下的文档进行词向量训练,获取多义词不同含义的词向量表示,用K?Means算法抽取文本的主题领域关键词,进行领域主题关键词相似度计算,最后对三类特征相似度进行融合,把相似度最高的候选实体作为最终的目标实体。本发明优于传统消歧方法,可以很好的满足实际应用的需求。 |