[发明专利]一种字符识别方法及字符识别装置在审
申请号: | 201710256378.1 | 申请日: | 2017-04-19 |
公开(公告)号: | CN107403130A | 公开(公告)日: | 2017-11-28 |
发明(设计)人: | 李云锦;杨晓庆;孙萌;王锐坚;赵玲玲;陈孟阳;阎鹏;邓澍军;郭常圳 | 申请(专利权)人: | 北京粉笔未来科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/32;G06K9/34 |
代理公司: | 北京智信禾专利代理有限公司11637 | 代理人: | 吴肖肖 |
地址: | 100093 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 字符 识别 方法 装置 | ||
技术领域
本发明涉及模式识别中的文字识别技术领域,特别涉及一种字符识别方法及字符识别装置。
背景技术
字符识别,主要是识别图像上的中文字符或英文字符,通过拍照或者截取包含字符的图像,然后识别该图像中的字符内容,最后将识别该图像中的字符内容输出成可编辑的电子化文本。
目前针对字符识别的技术主要有以下几种:
第一种,用滑动窗口对目标图像进行切分,拿切分块和样本集进行对比识别,但是手写体样本多样、变化多,框体的大小不好确定;
第二种,在用户手写输入的时候采集用户书写轨迹,通过判断轨迹走势识别手写字符,但是该方法只能识别用户现场书写的轨迹,无法对损失了用户书写轨迹的手写字符图像进行识别;
第三种,通过传统的光学字符识别技术识别扫描仪扫描出的含有手写字符图像中的字符,但是目前智能手机拍出图像的清晰度相比扫描仪差很多,传统的光学字符识别技术对这种清晰度较差的图像上的手写字符进行识别。
以上几种对字符识别的方法均有不足,不能一次性快速准确的将大篇幅的字符图像中的字符识别成电子化文本。
发明内容
有鉴于此,本申请提供一种字符识别方法及字符识别装置,以实现快速准确的对大篇幅的手字符图像中的字符进行识别。
一方面,本申请提供一种字符识别方法,包括:
获取包含待识别字符的图像;
对所述图像进行区域分割并获取每个区域的文本块;
依次将每个文本块同时输入到至少两个识别模块进行识别,其中:每个所述识别模块有一个置信度,且所述至少两个识别模块的置信度不同;
当所述识别模块之间识别的结果不同时,以置信度高的识别模块的识别结果作为当前文本块的识别结果;
将所有文本块的识别结果进行整合,得到对所述图像中字符识别的结果。
另一方面,本申请提供一种字符识别装置,包括:
获取模块,用于获取包含待识别字符的图像;
分割模块,用于所述图像进行区域分割并获取每个区域的文本块;
输入模块,用于依次将每个文本块同时输入到至少两个识别模块进行识别,其中:每个所述识别模块有各自的置信度,且所述识别模块的置信度不同;
处理模块,当所述识别模块之间识别的结果不同时,以置信度高的识别模块的识别结果作为当前文本块的识别结果;
整合模块,将所有文本块的识别结果进行整合,得到对所述图像中字符识别的结果。
本发明申请提供的一种字符识别方法及字符识别装置利用至少两个识别模块对包含待识别字符的图像中的字符进行识别,基于所述至少两个识别模块的识别结果和不同的置信度给出了较为准确的识别结果,解决了不能一次性快速准确的将大篇幅的字符图像中的字符识别成电子化文本的问题。
附图说明
图1为本申请一实施例提供的字符识别方法的流程图;
图2为本申请一实施例提供的字符识别方法的流程图;
图3为本申请一实施例提供的字符识别方法中对图像进行预处理的示意图;
图4为本申请一实施例采用CNN(卷积神经网络)识别模块和RNN(循环神经网络)识别模块进行字符识别方法的流程图;
图5-1为用手机拍摄的一篇手写英文作文图像;
图5-2为图5-1所示的图像进行预处理之后的图像;
图5-3为图5-2所示的图像进行区域分割获取的单独文本块;
图5-4为图5-3所示的每个文本块进行识别后的识别结果;
图5-5为图5-4所示的识别结果进行整合后得到的电子化文本内容;
图6为本申请一实施例提供的一种字符识别装置的结构示意图;
图7为本申请一实施例提供的电子设备的硬件结构示意图。
具体实施方式
本发明实施例提供的一种字符识别方法及字符识别装置,首先对含有字符的图像进行预处理和二值化,然后基于深度学习多识别模块对图像中的字符进行识别,使得字符识别更为快速和准确。下面结合附图,对本发明的实施方式和实施过程做详细说明。
现有的字符识别技术对于印刷体图像、具有书写轨迹的图像以及使用扫描仪扫描的图像上的字符识别效果较好,但是不适用于一次性的将大篇的字符图像中的快速准确的识别成文本。
基于现有技术中字符识别方法的不足,本申请提供的一种字符识别方法及一种字符识别装置,能够一次性快速准确的识别图像中的大篇幅字符,将图像中的字符内容电子化。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京粉笔未来科技有限公司,未经北京粉笔未来科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710256378.1/2.html,转载请声明来源钻瓜专利网。