| 毛存礼,谢旭阳,余正涛*,高盛祥,王振晗,刘福浩. | |
| 基于知识蒸馏的缅甸语光学字符识别方法 | |
| 数据采集与处理 | |
| 2022 | |
| 与传统的图像文本识别任务不同,缅甸语光学字符识别(Opticalcharacterrecognition,OCR)需要计算机在一个感受野内识别由多个字符嵌套组合的复杂字符,这给缅甸语OCR任务带来了巨大的挑战。为了解决该问题,提出了一种基于知识蒸馏的缅甸语OCR方法,构建了使用卷积神经网络(Conyolutionalneuralnetworks,(NN)一循环神经网络(Recurrentneuralnetwork.RNN)框架的教师网络和学生网络,以集成学习的方式进行训练的模型架构,在训练过程中通过教师集成的子网络与学生网络进行耦合,实现学生网络中单个感受野对应的局部字符图像特征与教师网络中整体字符图像特征的对齐,以此增强对长序列字符图像中局部特征的获取。实验结果表明,在没有背景噪声图像和有背景噪声图像作为训练数据集的情况下,本文模型的性能分别优于基线2.9%和2.7%。 | |
| 点击此处下载文章内容 | |