[发明专利]字符识别方法和字符识别装置在审

申请号：	201910983086.7	申请日：	2019-10-16
公开（公告）号：	CN112668372A	公开（公告）日：	2021-04-16
发明（设计）人：	沙浩	申请（专利权）人：	株式会社日立制作所
主分类号：	G06K9/00	分类号：	G06K9/00;G06K9/46;G06N3/04;G06N3/08
代理公司：	上海华诚知识产权代理有限公司 31300	代理人：	肖华
地址：	日本国东京都千***	国省代码：	暂无信息
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	字符识别方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明涉及一种字符识别方法和字符识别装置，本发明的字符识别方法，包括：字符行定位步骤，读取包含待识别字符的图像，基于深度学习对由所述待识别字符构成的各字符行进行定位；目标图像切割步骤，在所述各字符行中存在位置重叠的重叠字符行的情况下，将包含所述重叠字符行的图像部分切割出来作为目标图像；重叠字符行分割步骤，对所述目标图像进行图像处理，使得所述重叠字符行中的各行分割开并重新定位；以及字符识别步骤，对完成定位的所述各字符行进行字符识别。

技术领域

本发明涉及一种字符识别方法和字符识别装置。

背景技术

基于深度学习的光学字符识别技术因其在现实生活中的实用性得到了广泛的关注。目前光学字符识别技术的应用主要集中在扫描文档字符识别。使用该技术对一般的扫描文档进行字符识别具有比较高的识别准确率。但在扫描文档中存在水印、邮戳印等噪音干扰或是文档字符较小的情况下，存在无法准确进行字符识别的技术问题。

发明内容

发明要解决的问题

针对待识别图像中存在噪音干扰或文档字符较小而无法准确进行字符识别的技术问题，本发明提出一种字符识别方法和字符识别装置。

解决问题的技术手段

本发明的字符识别方法，包括：字符行定位步骤，读取包含待识别字符的图像，基于深度学习对由所述待识别字符构成的各字符行进行定位；目标图像切割步骤，在所述各字符行中存在位置重叠的重叠字符行的情况下，将包含所述重叠字符行的图像部分切割出来作为目标图像；重叠字符行分割步骤，对所述目标图像进行图像处理，使得所述重叠字符行中的各行分割开并重新定位；以及字符识别步骤，对完成定位的所述各字符行进行字符识别。

本发明的字符识别装置，包括：字符行定位部，其读取包含待识别字符的图像，基于深度学习对由所述待识别字符构成的各字符行进行定位；目标图像切割部，其在所述各字符行中存在位置重叠的重叠字符行的情况下，将包含所述重叠字符行的图像部分切割出来作为目标图像；重叠字符行分割部，其对所述目标图像进行图像处理，使得所述重叠字符行中的各行分割开并重新定位；以及字符识别部，其对完成定位的所述各字符行进行字符识别。

发明的效果

根据本发明的字符识别方法和字符识别装置，即使待识别图像中存在噪音干扰或文档字符较小也能够准确进行字符识别。

附图说明

图1是示出实施例1中记载的字符识别方法的流程图。

图2的(a)～(c)是示出本发明的字符识别的实例的示意图。

图3的(a)～(d)是示出本发明的重叠字符行的分割实例的示意图。

图4是示出重叠字符行分割处理的流程图。

图5是示出实施例2中记载的字符识别方法的流程图。

图6是示出实施例3中记载的字符识别方法的流程图。

图7是示出本发明的字符识别装置的构成图。

具体实施方式

以下，参照附图1～6，对本发明的字符识别方法的具体实施方式进行说明。

实施例1

图1是示出实施例1中记载的字符识别方法的流程图。图2的(a)～(c)是示出本发明的字符识别的实例的示意图。图3的(a)～(d)是示出本发明的重叠字符行的分割实例的示意图。

如图1所示，在步骤S1中，读取包含待识别字符的图像，基于深度学习对由待识别字符构成的各字符行进行定位。图2的(a)示出待识别图像的实例，该待识别图像包含三行，其中上两行之间存在水印。图2的(b)示出对各字符行进行定位的实例。在定位过程中，先定位各个待识别字符，然后对由待识别字符构成的各字符行进行定位。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于株式会社日立制作所，未经株式会社日立制作所许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201910983086.7/2.html，转载请声明来源钻瓜专利网。

上一篇：一种用于给减震器涂抹阻尼油的装置
下一篇：一种色彩的调整方法和装置、计算机设备、可读存储介质

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]字符识别方法和字符识别装置在审

专利文献下载