![]() |
一种多特征融合的汉越新闻观点句抽取方法 |
![]() |
余正涛,唐珊,王剑,相艳,林思琦,郭军军,线岩团 |
![]() |
发明专利 |
![]() |
已授权 |
![]() |
201910634929.2 |
![]() |
2019-07-15 |
![]() |
2019-11-19 |
![]() |
2022-12-13 |
![]() |
本发明涉及一种多特征融合的汉越新闻观点句抽取方法,属于自然语言处理技术领域。本发明首先采用跨语言表示学习的方法构建汉越双语词嵌入模型。然后计算了句子主题、情感和位置的特征权重,将这些特征权重信息融入到编码层和注意力机制中,得到了句子在主题、情感和位置等方面的表征。最后根据得到的句子表征进行观点句分类。本发明针对汉语和越南语标记资源不平衡的问题,构建了汉越双语词嵌入模型;然后分别计算句子的主题、位置以及情感特征的权重,并将这些句子权重分别融入词向量和注意力机制中,实现句子语义信息和情感、主题、位置特征的结合,本发明可以有效提升汉越新闻观点句抽取的准确率。 |