您好!欢迎访问云南省人工智能重点实验室
科研成果
当前位置:首页>科研成果>专利

专利


名称: 融合发音特征的越南语语音识别文本纠错方法及系统 
作者: 余正涛, 杨尚龙, 王文君, 董凌, 孙童  
类型: 发明专利  
状态: 已授权  
专利号/登记号: 202311040757.9 
申请日/受理日: 2023-08-18 
公告日: 2023-09-15 
授权日: 2023-10-20 
简介: 本发明涉及融合发音特征的越南语语音识别文本纠错方法及系统,属于自然语言处理技术领域。本发明利用国际音标(IPA)对越南语发音进行表征的方法,并在模型编码阶段通过交叉注意力机制融合对应文本序列的发音特征。由于越南语一个发音对应多种语义的特点,将发音特征融入模型中扩大了搜索空间,提高了模型的错误检测和生成能力。此外,本发明使用基于非自回归结构的解码器,可以并行地生成目标序列中的所有单词,从而极大地降低解码时延。实验结果表明,在同等数据集上,该方法相比通用文本纠错模型实现约1%的词错率降低,同时节省近50%的解码时间消耗。