[发明专利]字符识别方法及装置、电子设备、存储介质有效

申请号：	202010253622.0	申请日：	2020-04-02
公开（公告）号：	CN111428723B	公开（公告）日：	2021-08-24
发明（设计）人：	张耀营;鄢丽萍;高文强;马祥;徐众;孟小路	申请（专利权）人：	苏州杰锐思智能科技股份有限公司
主分类号：	G06K9/34	分类号：	G06K9/34;G06N3/04;G06N3/08
代理公司：	北京超凡宏宇专利代理事务所(特殊普通合伙) 11463	代理人：	李飞
地址：	215100 江苏***	国省代码：	江苏;32
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	字符识别方法装置电子设备存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本申请提供一种字符识别方法及装置、电子设备、计算机可读存储介质，方法包括：采集待识别图像；将所述待识别图像作为已训练的目标检测网络的输入，获得所述目标检测网络输出的所述待识别图像的字符位置信息；从所述待识别图像中裁切出与所述字符位置信息对应的待识别子图像；将所述待识别子图像作为已训练的分类网络的输入，获得所述分类网络输出的所述待识别子图像中的字符；依据所述字符位置信息排序对应于每一字符位置信息的字符，得到字符识别结果。本申请通过依据深度学习的方法以定位加分类的方式，提高了复杂背景下字符识别正确率。

技术领域

本申请涉及图像处理技术领域，特别涉及一种字符识别方法及装置、电子设备、计算机可读存储介质。

背景技术

光学字符识别(OCR，Optical Character Recognition)是指电子设备通过检测图像上字符暗、亮的模式确定其形状，从而将形状翻译成计算机文字的过程。光学字符识别被广泛地应用于生产和生活的各类场景中。简单背景下的光学字符识别的正确率已经可以满足应用的需求，而对于复杂背景，识别正确率仍有较大的提升空间。

发明内容

本申请实施例的目的在于提供一种字符识别方法及装置、电子设备、计算机可读存储介质，用于提高复杂背景下的字符识别正确率。

一方面，本申请提供了一种字符识别方法，包括：

采集待识别图像；

将所述待识别图像作为已训练的目标检测网络的输入，获得所述目标检测网络输出的所述待识别图像的字符位置信息；

从所述待识别图像中裁切出与所述字符位置信息对应的待识别子图像；

将所述待识别子图像作为已训练的分类网络的输入，获得所述分类网络输出的所述待识别子图像中的字符；

依据所述字符位置信息排序对应于每一字符位置信息的字符，得到字符识别结果。

在一实施例中，所述将所述待识别图像作为已训练的目标检测网络的输入，获得所述目标检测网络输出的所述待识别图像中的字符位置信息，包括：

将所述待识别图像作为所述目标检测网络的输入，通过所述目标检测网络将所述待识别图像划分为多个单元格、对每一单元格计算得到边界框预测结果；其中，所述边界框预测结果包括中心点相对坐标、边界框置信度；

筛选所述边界框置信度大于第一阈值的边界框预测结果，作为边界框识别结果；

基于所述边界框识别结果对应单元格的位置信息，将所述边界框识别结果中的中心点相对坐标调整为中心点坐标，得到所述字符位置信息。