![]() |
融入领域术语词典的司法舆情敏感信息识别方法 |
![]() |
余正涛,张泽锋,黄于欣,郭军军,相艳,高盛祥 |
![]() |
发明专利 |
![]() |
已授权 |
![]() |
202010984681.5 |
![]() |
2020-09-18 |
![]() |
2021-01-15 |
![]() |
2022-07-29 |
![]() |
本发明涉及融入领域术语词典的司法舆情敏感信息识别方法。本发明首先使用双向循环神经网络和多头注意力机制对舆情文本和领域术语词典分别进行编码,抽取显著特征;其次将领域术语词典作为分类的指导知识,与舆情文本构建相似矩阵,得到融入领域术语词典的文本表征;然后利用多头注意力机制和卷积神经网络进一步提取全局和局部特征,最终实现敏感信息分类。本发明将领域术语词典与司法舆情上下文信息进行融合,技能利用上下文信息弥补传统方法在上下文信息中表征效果不佳,又能利用领域知识增强文本中与司法信息相关的词语的语义特征表示,从而提高司法舆情敏感信息识别的性能。 |