您好!欢迎访问云南省人工智能重点实验室
科研成果
当前位置:首页>科研成果>专利

专利


名称: 融合词典与对抗迁移的越南语事件实体识别方法 
作者: 余正涛,薛振宇,线岩团,相艳,王红斌 
类型: 发明专利  
状态: 已授权  
专利号/登记号: 202110164070.0 
申请日/受理日: 2021-02-05 
公告日: 2021-06-08 
授权日: 2022-07-29 
简介: 本发明涉及融合词典与对抗迁移的越南语事件实体识别方法。本发明将越南语作为目标语言,分别将英语和汉语作为源语言,利用源语言的实体标注信息和双语词典提升目标语言的实体识别效果。本发明首先利用词级别对抗迁移实现源语言与目标语言的语义空间共享,再融合双语词典进行多粒度特征嵌入以丰富目标语言词的语义表征,之后使用句子级别对抗迁移提取到与语言无关的序列特征,最后通过CRF标注出实体识别结果。在越南语新闻数据集上的实验结果表明,在源语言为英语和汉语的情况下,所提模型相较于单语实体识别模型与当前主流的迁移学习模型的实体识别效果均有提升,相较于单语实体识别模型的F1值分别增加了19.61和18.73。