[发明专利]字符识别方法及装置、电子设备、存储介质有效
申请号: | 202010253622.0 | 申请日: | 2020-04-02 |
公开(公告)号: | CN111428723B | 公开(公告)日: | 2021-08-24 |
发明(设计)人: | 张耀营;鄢丽萍;高文强;马祥;徐众;孟小路 | 申请(专利权)人: | 苏州杰锐思智能科技股份有限公司 |
主分类号: | G06K9/34 | 分类号: | G06K9/34;G06N3/04;G06N3/08 |
代理公司: | 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 | 代理人: | 李飞 |
地址: | 215100 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 字符 识别 方法 装置 电子设备 存储 介质 | ||
本申请提供一种字符识别方法及装置、电子设备、计算机可读存储介质,方法包括:采集待识别图像;将所述待识别图像作为已训练的目标检测网络的输入,获得所述目标检测网络输出的所述待识别图像的字符位置信息;从所述待识别图像中裁切出与所述字符位置信息对应的待识别子图像;将所述待识别子图像作为已训练的分类网络的输入,获得所述分类网络输出的所述待识别子图像中的字符;依据所述字符位置信息排序对应于每一字符位置信息的字符,得到字符识别结果。本申请通过依据深度学习的方法以定位加分类的方式,提高了复杂背景下字符识别正确率。
技术领域
本申请涉及图像处理技术领域,特别涉及一种字符识别方法及装置、电子设备、计算机可读存储介质。
背景技术
光学字符识别(OCR,Optical Character Recognition)是指电子设备通过检测图像上字符暗、亮的模式确定其形状,从而将形状翻译成计算机文字的过程。光学字符识别被广泛地应用于生产和生活的各类场景中。简单背景下的光学字符识别的正确率已经可以满足应用的需求,而对于复杂背景,识别正确率仍有较大的提升空间。
发明内容
本申请实施例的目的在于提供一种字符识别方法及装置、电子设备、计算机可读存储介质,用于提高复杂背景下的字符识别正确率。
一方面,本申请提供了一种字符识别方法,包括:
采集待识别图像;
将所述待识别图像作为已训练的目标检测网络的输入,获得所述目标检测网络输出的所述待识别图像的字符位置信息;
从所述待识别图像中裁切出与所述字符位置信息对应的待识别子图像;
将所述待识别子图像作为已训练的分类网络的输入,获得所述分类网络输出的所述待识别子图像中的字符;
依据所述字符位置信息排序对应于每一字符位置信息的字符,得到字符识别结果。
在一实施例中,所述将所述待识别图像作为已训练的目标检测网络的输入,获得所述目标检测网络输出的所述待识别图像中的字符位置信息,包括:
将所述待识别图像作为所述目标检测网络的输入,通过所述目标检测网络将所述待识别图像划分为多个单元格、对每一单元格计算得到边界框预测结果;其中,所述边界框预测结果包括中心点相对坐标、边界框置信度;
筛选所述边界框置信度大于第一阈值的边界框预测结果,作为边界框识别结果;
基于所述边界框识别结果对应单元格的位置信息,将所述边界框识别结果中的中心点相对坐标调整为中心点坐标,得到所述字符位置信息。
在一实施例中,所述目标检测网络,通过如下方式训练得到:
将第一训练集中第一样本图像作为深度学习网络的输入,获得所述第一样本图像中的字符位置预测结果;其中,所述第一样本图像携带字符位置标签;
通过所述字符位置预测结果和所述字符位置标签计算置信度评分;
依据所述字符位置预测结果和所述字符位置标签之间的差异,以及所述置信度评分,调整所述深度学习网络的网络参数;
重复上述过程,直至所述深度学习网络收敛,得到所述目标检测网络。
在一实施例中,所述从所述待识别图像裁切与所述字符位置信息对应的待识别子图像,包括:
基于所述字符位置信息、预设裁切宽度和预设裁切高度,对所述待识别图像进行裁切,得到待识别子图像。
在一实施例中,所述分类网络,通过如下方式训练得到:
将第二训练集中第二样本图像作为深度学习网络的输入,获得对应于所述第二样本图像的分类结果;其中,所述第二样本图像携带字符标签;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州杰锐思智能科技股份有限公司,未经苏州杰锐思智能科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010253622.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种农业种植用施肥装置
- 下一篇:一种多功能汽车行李架结构