您好!欢迎访问云南省人工智能重点实验室
科研成果
当前位置:首页>科研成果>专利

专利


名称: 一种多特征融合的汉越新闻观点句抽取方法 
作者: 余正涛,唐珊,王剑,相艳,林思琦,郭军军,线岩团 
类型: 发明专利  
状态: 已授权  
专利号/登记号: 201910634929.2 
申请日/受理日: 2019-07-15 
公告日: 2019-11-19 
授权日: 2022-12-13 
简介: 本发明涉及一种多特征融合的汉越新闻观点句抽取方法,属于自然语言处理技术领域。本发明首先采用跨语言表示学习的方法构建汉越双语词嵌入模型。然后计算了句子主题、情感和位置的特征权重,将这些特征权重信息融入到编码层和注意力机制中,得到了句子在主题、情感和位置等方面的表征。最后根据得到的句子表征进行观点句分类。本发明针对汉语和越南语标记资源不平衡的问题,构建了汉越双语词嵌入模型;然后分别计算句子的主题、位置以及情感特征的权重,并将这些句子权重分别融入词向量和注意力机制中,实现句子语义信息和情感、主题、位置特征的结合,本发明可以有效提升汉越新闻观点句抽取的准确率。