![]() |
基于知识蒸馏的缅甸语OCR方法 |
![]() |
毛存礼,谢旭阳,余正涛,高盛祥,王振晗,刘福浩 |
![]() |
发明专利 |
![]() |
已授权 |
![]() |
202010978722.X |
![]() |
2020-09-17 |
![]() |
2021-01-29 |
![]() |
2022-06-14 |
![]() |
本发明涉及基于知识蒸馏的缅甸语OCR方法。本发明包括如下步骤:构建适应任务需求的缅甸语图像数据集;对生成的图像加噪,对图像所对应的标签编码进行规则性标注;构建使用深度卷积神经网络和循环神经网络框架的学生网络和教师网络的模型架构;基于知识蒸馏的方法将教师网络与学生网络以集成学习的方式进行联合训练,通过教师集成的子网络与学生网络进行耦合,实现学生网络中单个感受野对应的局部字符图像特征与教师网络中整体字符图像特征的对齐,以此增强对长序列字符图像中局部特征的获取,使学生网络通过调用服务器上的部署模型能够高效识别缅甸语复杂场景文本图像。本发明实现了对缅甸语图像文本的识别,且识别精确率高,效果好。 |