[发明专利]字符识别方法及装置、电子设备、存储介质有效
申请号: | 202010253622.0 | 申请日: | 2020-04-02 |
公开(公告)号: | CN111428723B | 公开(公告)日: | 2021-08-24 |
发明(设计)人: | 张耀营;鄢丽萍;高文强;马祥;徐众;孟小路 | 申请(专利权)人: | 苏州杰锐思智能科技股份有限公司 |
主分类号: | G06K9/34 | 分类号: | G06K9/34;G06N3/04;G06N3/08 |
代理公司: | 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 | 代理人: | 李飞 |
地址: | 215100 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 字符 识别 方法 装置 电子设备 存储 介质 | ||
1.一种字符识别方法,其特征在于,包括:
采集待识别图像;
将所述待识别图像作为已训练的目标检测网络的输入,获得所述目标检测网络输出的所述待识别图像的字符位置信息;其中,所述字符位置信息对应于单一字符;
从所述待识别图像中裁切出与所述字符位置信息对应的待识别子图像;
将所述待识别子图像作为已训练的分类网络的输入,获得所述分类网络输出的所述待识别子图像中的字符;
依据所述字符位置信息确定字符之间的相对位置关系;
基于所述相对位置关系和预设字符次序对字符进行排序,判断排序后的字符串中是否存在预设单位字符;其中,若所述字符串的字符与至少两个单位字符匹配,以最长的单位字符为准;
若存在,基于所述单位字符拆分所述字符串,得到至少两个字符串,将拆分得到的字符串作为字符识别结果。
2.根据权利要求1所述的方法,其特征在于,所述将所述待识别图像作为已训练的目标检测网络的输入,获得所述目标检测网络输出的所述待识别图像中的字符位置信息,包括:
将所述待识别图像作为所述目标检测网络的输入,通过所述目标检测网络将所述待识别图像划分为多个单元格、对每一单元格计算得到边界框预测结果;其中,所述边界框预测结果包括中心点相对坐标、边界框置信度;
筛选所述边界框置信度大于第一阈值的边界框预测结果,作为边界框识别结果;
基于所述边界框识别结果对应单元格的位置信息,将所述边界框识别结果中的中心点相对坐标调整为中心点坐标,得到所述字符位置信息。
3.根据权利要求1所述的方法,其特征在于,所述目标检测网络,通过如下方式训练得到:
将第一训练集中第一样本图像作为深度学习网络的输入,获得所述第一样本图像中的字符位置预测结果;其中,所述第一样本图像携带字符位置标签;
通过所述字符位置预测结果和所述字符位置标签计算置信度评分;
依据所述字符位置预测结果和所述字符位置标签之间的差异,以及所述置信度评分,调整所述深度学习网络的网络参数;
重复上述过程,直至所述深度学习网络收敛,得到所述目标检测网络。
4.根据权利要求1所述的方法,其特征在于,所述从所述待识别图像裁切与所述字符位置信息对应的待识别子图像,包括:
基于所述字符位置信息、预设裁切宽度和预设裁切高度,对所述待识别图像进行裁切,得到待识别子图像。
5.根据权利要求1所述的方法,其特征在于,所述分类网络,通过如下方式训练得到:
将第二训练集中第二样本图像作为深度学习网络的输入,获得对应于所述第二样本图像的分类结果;其中,所述第二样本图像携带字符标签;
通过所述字符标签和所述分类结果之间的差异,调整所述深度学习网络的网络参数;
重复上述过程,直至所述深度学习网络收敛,得到所述分类网络。
6.一种字符识别装置,其特征在于,包括:
采集模块,用于采集待识别图像;
定位模块,用于将所述待识别图像作为已训练的目标检测网络的输入,获得所述目标检测网络输出的所述待识别图像的字符位置信息;其中,所述字符位置信息对应于单一字符;
裁切模块,用于从所述待识别图像中裁切出与所述字符位置信息对应的待识别子图像;
识别模块,用于将所述待识别子图像作为已训练的分类网络的输入,获得所述分类网络输出的所述待识别子图像中的字符;
排序模块,用于依据所述字符位置信息确定字符之间的相对位置关系;基于所述相对位置关系和预设字符次序对字符进行排序,判断排序后的字符串中是否存在预设单位字符;其中,若所述字符串的字符与至少两个单位字符匹配,以最长的单位字符为准;若存在,基于所述单位字符拆分所述字符串,得到至少两个字符串,将拆分得到的字符串作为字符识别结果。
7.一种电子设备,其特征在于,所述电子设备包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为执行权利要求1-5任意一项所述的字符识别方法。
8.一种计算机可读存储介质,其特征在于,所述存储介质存储有计算机程序,所述计算机程序可由处理器执行以完成权利要求1-5任意一项所述的字符识别方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州杰锐思智能科技股份有限公司,未经苏州杰锐思智能科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010253622.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种农业种植用施肥装置
- 下一篇:一种多功能汽车行李架结构