您好!欢迎访问云南省人工智能重点实验室
科研成果
当前位置:首页>科研成果>论文列表

论文列表



 论   文  作   者: 陆杉, 毛存礼, 余正涛, 高盛祥, 黄于欣, 王振晗.
 论   文  名   称: 融合多粒度特征的低资源语言词性标记和依存分析联合模型
 论文发表刊物: 第二十届中国计算语言学大会
 会   议  地   点:
 会   议  时   间:
 卷   号  页   码:
 论   文  描   述:
 收   录  情   况: EI Indexed  
  论   文  摘   要:
        研究低资源语言的词性标记和依存分析对推动低资源自然语言处理任务有着重要的作用。针对低资源语言词嵌入表示,已有工作并没有充分利用字符、子词层面信息编码,导致模型无法利用不同粒度的特征,对此,提出融合多粒度特征的词嵌入表示利用不同的语言模型分别获得字符、子词以及词语层面的语义信息,将三种粒度的记嵌入进行拼接,达到丰富语义信息的目的,缓解由于标注数据稀缺导致的依存分析模型性能不佳的问题。进一步将词性标记和依存分析模型进行联合训练,使模型之间能相互共享知识,降低词性标记错误在依存分析任务上的线性传递。以泰语、越南语为研究对象,在宾州树库数据集上,提出方法相比于基线模型的UAS、LAS、POS均有明显提升。
点击此处下载文章内容