[发明专利]一种基于深度学习的单个汉字识别方法有效
申请号: | 201910716935.2 | 申请日: | 2019-08-05 |
公开(公告)号: | CN110414516B | 公开(公告)日: | 2022-02-01 |
发明(设计)人: | 刘晋;常思维 | 申请(专利权)人: | 上海海事大学 |
主分类号: | G06V20/62 | 分类号: | G06V20/62;G06V10/764;G06V30/28;G06K9/62 |
代理公司: | 上海元好知识产权代理有限公司 31323 | 代理人: | 徐雯琼;张妍 |
地址: | 201306 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 单个 汉字 识别 方法 | ||
本发明公开了一种基于深度学习的单个汉字识别方法,包括如下步骤:S1,预处理待识别文字图片;S2,将预处理后的图片输入神经网络并初步提取特征;S3,将初步提取的特征进行批量归一化处理并将归一化结果进行池化操作;S4,将池化后的数据继续卷积提取特征得到对应的特征向量;S5,将特征向量分别进行空间金字塔池化并进行拼接;S6,将拼接后的向量全连接后进行归一化处理生成预测结果。
技术领域
本发明涉及图像识别分类领域,特别涉及一种基于深度学习的单个汉字识别方法。
背景技术
文字作为人们平时信息交流的一种至关重要的工具,对整个社会的发展有着十分重要的影响。随着时代的不断进步,人们需要处理的文字与信息也越来越多,越来越多的数据与工作单单靠人工来进行识别和分析已经变得越发困难。研究一些方法对文字字符进行识别已经成为了目前的一个迫切的需求。
字符识别是文字字符识别的难点和热点。字符数量多,仅中文字符的常用词汇就有3000多个。目前,主要的字符识别方法可以分为三种类型:1.基于模板匹配的字符识别;2.基于支持向量机的字符识别;3.神经网络的字符识别。
神经网络是由大量神经元联结在一起的非线性数学模型。神经网络具有自组织自学习能力,可以在训练过程中直接接收数据并自适应地发现样本数据潜在的特征与规律;此外,神经网络还具有关联记忆存储、发散式推导以及高度并行性等特点。
模板匹配算法适用于没有旋转角的固定大小的单字符识别。通常采用的是对二值图像进行匹配。从实时性、算法复杂性等角度考虑,模板匹配算法能够满足字符识别的任务。但是模板匹配也有其缺陷,即对同一类字符在不同图像中的尺度多变性以及光照多变性敏感,容易产生匹配偏差。
基于支持向量机的字符算法主要是基于轮廓、网格、投影等统计特征,需要对数据进行降维。利用字符特征降维的方法现在逐渐利用到字符特征提取上,能够全面提取字符特征,字符识别效果更好,另外一种较多使用的降维方法是主成分分析法,但这种方法是从全局的角度对数据进行降维,并未考虑数据的局部特征,在降维过程中不可避免地损失了一些重要信息。
基于神经网络的字符识别,以卷积神经网络为例。其作为深度学习的一种实现模型,具有局部感知野和权值共享的特征,极大地减少了计算复杂度,在图文识别方面也得到了快速发展。但是针对质量差和复杂的图纸,传统的基于卷积神经网络的识别算法并不能得到较高的准确率。
近年来,也有一些较成熟的汉字识别工具,如Google的开源OCR系统等。然而,很少有研究涉及到在多字体情况下,如何有效地识别这些汉字。
传统的单个汉字识别方法往往聚焦于某一种特定字体的汉字,研究者通过对单个汉字特征进行针对性地提取,往往可以得到识别率较高的模型。然而,在现实环境中,往往会存在多种字体文字,甚至是艺术字体同时出现的场景,这种情况下,很难对不同字体的汉字进行统一的特征提取。
发明内容
本发明的目的是提供一种基于深度学习的单个汉字识别方法,融合了多种深度神经网络技术可以在提高正确率的同时,减少网络参数提高模型训练速度,同时对于不同大小、字体的手写体文字均可进行识别,适用范围广、鲁棒性强。
为了实现以上目的,本发明是通过以下技术方案实现的:
一种基于深度学习的单个汉字识别方法,其特点是,包括如下步骤:
S1,预处理待识别文字图片;
S2,将预处理后的图片输入神经网络并初步提取特征;
S3,将初步提取的特征进行批量归一化处理并将归一化结果进行池化操作;
S4,将池化后的数据继续卷积提取特征得到对应的特征向量;
S5,将特征向量分别进行空间金字塔池化并进行拼接;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海海事大学,未经上海海事大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910716935.2/2.html,转载请声明来源钻瓜专利网。