| 党雪云,王剑*. | |
| 基于门控图神经网络的新闻要素信息抽取方法 | |
| 电视技术 | |
| 2022 | |
| 新闻要素信息抽取是指从新闻文本中识别出人名、地名、领域要素等信息,对于快速理解新闻文本有着关键作用。本文以抽取涉案新闻领域的要素信息为例,提出基于门控图神经网络(Gated Graph Neural Netwonk,CCNN)融合案件相关词典的方法,利用图神经网络中结点与边之间的消息传播机制将外部词汇知识融入新闻文本中,挖掘文本潜在的语义特征,提高要素信息抽取性能。首先根据新闻文本特征选择领域相关的词汇构建案件相关词典,其次利用新闻文本和词典构建字粒度的组合图,通过 GGNN 模型对其进行编码得到字词组合关系的表征,最后利用 Bi-LSTM-CRF 模型解码得到要素信息序列。在标注的涉案新闻要素信息数据集上的实验结果表明,基于 GGNN 融入词典信息的要素抽取方法与常用的算法模型相比,F1 值有2.12%~5.34%的提高,取得了更稳定的性能。 | |
| 点击此处下载文章内容 | |