![]() |
基于神经自回归分布估计的涉案新闻主题模型构建方法及装置 |
![]() |
毛存礼,梁昊远,余正涛,郭军军,黄于欣,高盛祥 |
![]() |
发明专利 |
![]() |
已授权 |
![]() |
202010984648.2 |
![]() |
2020-09-18 |
![]() |
2021-03-02 |
![]() |
2021-11-23 |
![]() |
本发明涉及基于神经自回归分布估计的涉案新闻主题模型构建方法及装置,属于自然语言处理技术领域。本发明首先构建涉案新闻数据并预处理,得到案件要素库和涉案词向量;然后由iDocNADEe模型计算新闻和案件要素的双向隐状态;再用案件要素和新闻的双向隐状态构建注意力机制,对新闻隐状态加权;接下来利用神经自回归算法和案件要素加权的新闻隐状态计算案件要素指导的自回归条件概率;依据涉案新闻的自回归条件概率构建涉案主题模型,并利用涉案新闻主题模型进行涉案新闻检索。本发明在困惑度和主题连贯性以及文档检索精确率等指标上的表现均优于基线模型。 |