[发明专利]一种字符识别方法和装置有效
申请号: | 201910071756.8 | 申请日: | 2019-01-25 |
公开(公告)号: | CN109858542B | 公开(公告)日: | 2021-03-19 |
发明(设计)人: | 戴亦斌;谢春鸿 | 申请(专利权)人: | 广州云测信息技术有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 北京国昊天诚知识产权代理有限公司 11315 | 代理人: | 刘昕;南霆 |
地址: | 510260 广东省广州市中*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 字符 识别 方法 装置 | ||
本申请公开了一种字符识别方法和装置。方法包括:对显示有至少一个字符的第一字符图像进行第一处理,所述第一处理用于改变所述至少一个字符的形态;基于所述第一字符图像中的字符子图像,生成第二字符图像,所述字符子图像为单个字符所占区域的图像;对所述第二字符图像进行第二处理,所述第二处理用于在所述第二字符图像中添加干扰数据;基于所述第二字符图像和所述第二字符图像中的字符子图像所占区域,训练目标检测模型,以以供识别目标字符图像中的字符。可见,本申请通过目标检测模型对字符图像中的字符进行识别,能有效提高字符识别的准确度,为自动化测试过程中的验证码识别提供支持。
技术领域
本申请涉及计算机技术领域,尤其涉及一种字符识别方法和装置。
背景技术
字符识别是指对物品上印刷的字符、用户界面显示的字符等进行识别的过程。
目前的字符识别方案是利用计算机图像处理技术对显示字符串的图像进行二值、去噪点等处理后,对其中的字符进行分割,然后对单个字符利用OCR技术识别、或者使用深度学习的方式进行识别。但该方案对于字符间存在粘连、存在较粗的干扰线、字符宽度不一致等情况,存在无法对字符进行分割,导致识别成功率较低的问题。
因此,需要提供一种高精度的字符识别方案。
发明内容
本说明书实施例提供一种字符识别方法,用以解决字符识别成功率低的问题。
本说明书实施例还提供一种字符识别方法,包括:
对显示有至少一个字符的第一字符图像进行第一处理,所述第一处理用于改变所述至少一个字符的形态;
基于所述第一字符图像中的字符子图像,生成第二字符图像,所述字符子图像为单个字符所占区域的图像;
对所述第二字符图像进行第二处理,所述第二处理用于在所述第二字符图像中添加干扰数据;
基于所述第二字符图像和所述第二字符图像中的字符子图像所占区域,训练目标检测模型,以供识别目标字符图像中的字符。
本说明书实施例还提供一种字符识别装置,包括:
第一处理模块,用于对显示有至少一个字符的第一字符图像进行第一处理,所述第一处理用于改变所述至少一个字符的形态;
第二处理模块,用于基于所述第一字符图像中的字符子图像,生成第二字符图像,所述字符子图像为单个字符所占区域的图像;
第三处理模块,用于对所述第二字符图像进行第二处理,所述第二处理用于在所述第二字符图像中添加干扰数据;
训练模块,用于基于所述第二字符图像和所述第二字符图像中的字符子图像所占区域,训练目标检测模型,以供识别目标字符图像中的字符。
本说明书实施例还提供一种电子设备,包括:
处理器;以及
被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器执行上述字符识别方法的步骤。
本说明书实施例还提供一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上述字符识别方法的步骤。
本说明书实施例采用的上述至少一个技术方案能够达到以下有益效果:
通过将字符图像及其中的字符子图像作为样本数据来训练目标检测模型,以基于训练完成的目标检测模型识别目标字符图像中的字符。与现有技术中OCR技术识别方案相比,能有效提高字符的识别成功率,为自动化测试过程中的验证码识别提供支持,达到可通过验证码的自动识别,提高自动化测试的适用范围的目的。
附图说明
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州云测信息技术有限公司,未经广州云测信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910071756.8/2.html,转载请声明来源钻瓜专利网。