您好!欢迎访问云南省人工智能重点实验室
科研成果
当前位置:首页>科研成果>论文列表

论文列表



 论   文  作   者: 赖华,高玉梦,黄于欣*,余正涛,张勇丙.
 论   文  名   称: 基于多粒度特征的文本生成评价方法
 论文发表刊物: 中文信息学报
 论文发表时间: 2022
 卷   号  页   码:
 论   文  描   述:
 收   录  情   况:
  论   文  摘   要:
        近年来,基于预训练语言模型的文本生成评价方法得到了广泛关注,其通过计算两个句子间子词粒度的相似度来评价生成文本的质量。但是对于越南语、泰语等存在大量黏着语素的语言,单个音节或子词不能独立成词表达语义,仅基于子词粒度匹配的方法并不能够完整表征两个句子间的语义相似关系。基于此,该文提出一种基于子词、音节、词组等多粒度特征的文本生成评价方法。首先基于 MBERT 模型生成文本的表示,然后引入音节,词组等粗粒度语义单元之间的相似性来增强子词粒度的相似度评价模型。在机器翻译、跨语言摘要、跨语言数据筛选等任务上的实验结果表明,该文提出的多粒度特征评价方法相比 ROUGE、BLEU等基于统计的评价方法以及Bertscore 等基于语义相似度的评价方法都取得了更好的性能,与人工评价结果相关性更高。
点击此处下载文章内容