![]() |
基于预训练融合语音特征的文本标点恢复方法 |
![]() |
高盛祥, 孙童, 赖华, 余正涛 |
![]() |
发明专利 |
![]() |
已授权 |
![]() |
202111557681.8 |
![]() |
2021-12-20 |
![]() |
2022-09-06 |
![]() |
2023-03-07 |
![]() |
本发明涉及基于预训练融合语音特征的文本标点恢复方法,属于人工智能领域,本发明使用预训练语言模型获取到原始文本更丰富的信息特征,使用注意力机制对文本进行无视序列长度的语义对齐,将每个词编码成为包含全局语义的隐向量;此基础上将文本信息特征与其对应的原始音频特征在时间上进行对齐,在嵌入空间上进行融合,得到混合了语义信息与音频信息的融合特征,将更多文本无法有效包含的说话人声调、音高、停顿以及静默时间等特征信息提供给模型。 |