![]() |
融入篇章语义的涉案新闻要素实体识别方法及系统 |
![]() |
线岩团,王佳雯,王剑,余正涛,郭军军,相艳 |
![]() |
发明专利 |
![]() |
已授权 |
![]() |
202110023176.9 |
![]() |
2021-01-08 |
![]() |
2021-04-20 |
![]() |
2022-07-29 |
![]() |
本发明涉及融入篇章语义的涉案新闻要素实体识别方法及系统,属于自然语言处理技术领域。本发明首先从中国新闻网大案要案模块爬取语料,将所获新闻文本首段进行删减,获取新闻中心句,构建新闻正文句和其所对应新闻中心句的数据库,其次采用多头注意力机制从新闻中心句中学习篇章语义表示,并将其与新闻正文句相融合;再通过Bi?LSTM获取融入篇章语义后的上下文信息,最后采用条件随机场识别句子中的要素实体。本发明针对涉案新闻正文句子中普遍存在成分指代和成分省略的特点提出的融入篇章语义的涉案新闻要素实体识别方法,有效缓解上下文语义缺失的问题。为后续的涉案新闻舆情分析工作提供强有力的支撑。 |