[发明专利]字符识别方法和字符识别装置在审
申请号: | 201910983086.7 | 申请日: | 2019-10-16 |
公开(公告)号: | CN112668372A | 公开(公告)日: | 2021-04-16 |
发明(设计)人: | 沙浩 | 申请(专利权)人: | 株式会社日立制作所 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/46;G06N3/04;G06N3/08 |
代理公司: | 上海华诚知识产权代理有限公司 31300 | 代理人: | 肖华 |
地址: | 日本国东京都千*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 字符 识别 方法 装置 | ||
本发明涉及一种字符识别方法和字符识别装置,本发明的字符识别方法,包括:字符行定位步骤,读取包含待识别字符的图像,基于深度学习对由所述待识别字符构成的各字符行进行定位;目标图像切割步骤,在所述各字符行中存在位置重叠的重叠字符行的情况下,将包含所述重叠字符行的图像部分切割出来作为目标图像;重叠字符行分割步骤,对所述目标图像进行图像处理,使得所述重叠字符行中的各行分割开并重新定位;以及字符识别步骤,对完成定位的所述各字符行进行字符识别。
技术领域
本发明涉及一种字符识别方法和字符识别装置。
背景技术
基于深度学习的光学字符识别技术因其在现实生活中的实用性得到了广泛的关注。目前光学字符识别技术的应用主要集中在扫描文档字符识别。使用该技术对一般的扫描文档进行字符识别具有比较高的识别准确率。但在扫描文档中存在水印、邮戳印等噪音干扰或是文档字符较小的情况下,存在无法准确进行字符识别的技术问题。
发明内容
发明要解决的问题
针对待识别图像中存在噪音干扰或文档字符较小而无法准确进行字符识别的技术问题,本发明提出一种字符识别方法和字符识别装置。
解决问题的技术手段
本发明的字符识别方法,包括:字符行定位步骤,读取包含待识别字符的图像,基于深度学习对由所述待识别字符构成的各字符行进行定位;目标图像切割步骤,在所述各字符行中存在位置重叠的重叠字符行的情况下,将包含所述重叠字符行的图像部分切割出来作为目标图像;重叠字符行分割步骤,对所述目标图像进行图像处理,使得所述重叠字符行中的各行分割开并重新定位;以及字符识别步骤,对完成定位的所述各字符行进行字符识别。
本发明的字符识别装置,包括:字符行定位部,其读取包含待识别字符的图像,基于深度学习对由所述待识别字符构成的各字符行进行定位;目标图像切割部,其在所述各字符行中存在位置重叠的重叠字符行的情况下,将包含所述重叠字符行的图像部分切割出来作为目标图像;重叠字符行分割部,其对所述目标图像进行图像处理,使得所述重叠字符行中的各行分割开并重新定位;以及字符识别部,其对完成定位的所述各字符行进行字符识别。
发明的效果
根据本发明的字符识别方法和字符识别装置,即使待识别图像中存在噪音干扰或文档字符较小也能够准确进行字符识别。
附图说明
图1是示出实施例1中记载的字符识别方法的流程图。
图2的(a)~(c)是示出本发明的字符识别的实例的示意图。
图3的(a)~(d)是示出本发明的重叠字符行的分割实例的示意图。
图4是示出重叠字符行分割处理的流程图。
图5是示出实施例2中记载的字符识别方法的流程图。
图6是示出实施例3中记载的字符识别方法的流程图。
图7是示出本发明的字符识别装置的构成图。
具体实施方式
以下,参照附图1~6,对本发明的字符识别方法的具体实施方式进行说明。
实施例1
图1是示出实施例1中记载的字符识别方法的流程图。图2的(a)~(c)是示出本发明的字符识别的实例的示意图。图3的(a)~(d)是示出本发明的重叠字符行的分割实例的示意图。
如图1所示,在步骤S1中,读取包含待识别字符的图像,基于深度学习对由待识别字符构成的各字符行进行定位。图2的(a)示出待识别图像的实例,该待识别图像包含三行,其中上两行之间存在水印。图2的(b)示出对各字符行进行定位的实例。在定位过程中,先定位各个待识别字符,然后对由待识别字符构成的各字符行进行定位。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于株式会社日立制作所,未经株式会社日立制作所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910983086.7/2.html,转载请声明来源钻瓜专利网。