[发明专利]用于识别图像的方法、装置及电子设备在审
申请号: | 202210878112.1 | 申请日: | 2022-07-25 |
公开(公告)号: | CN115205865A | 公开(公告)日: | 2022-10-18 |
发明(设计)人: | 张亮;王玉芳;王志明;卢肖帆;常洪源 | 申请(专利权)人: | 华云(河北雄安)大数据科技有限公司 |
主分类号: | G06V30/148 | 分类号: | G06V30/148;G06V30/14;G06V30/168;G06V30/18;G06V30/42 |
代理公司: | 北京中知星原知识产权代理事务所(普通合伙) 11868 | 代理人: | 艾变开 |
地址: | 071799 河北省保定市容*** | 国省代码: | 河北;13 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 识别 图像 方法 装置 电子设备 | ||
1.一种用于识别图像的方法,其特征在于,所述方法包括:
获取待识别图像,所述待识别图像的预定区域中包括由数字组成的字符串;
将所述待识别图像输入预先训练的目标图像识别模型,得到多通道的输出图像,所述输出图像中的每个通道对应一个预设数字的置信度预测图;
基于所述置信度预测图,确定所述预设数字在所述字符串中的位置;
基于所述预设数字在所述字符串中的位置,将各所述预设数字组合成所述字符串的识别结果。
2.根据权利要求1所述的方法,其特征在于,基于所述置信度预测图,确定所述预设数字在所述字符串中的位置,包括:
从所述输出图像中提取出所述通道对应的置信度预测图;
对所述置信度预测图进行平滑处理和二值化处理,得到处理后的预测图;
对所述处理后的预测图中的预定区域进行连通区域分析,确定所述处理后的预测图中的预定区域内的连通域;
基于所述连通域的位置,确定所述通道对应的预设数字在所述字符串中的位置。
3.根据权利要求2所述的方法,其特征在于,所述输出图像包括11个通道,其中,10个通道分别对应数字0至9的置信度预测图,1个通道对应存在涂改痕迹的数字的置信度预测图。
4.根据权利要求1至3之一所述的方法,其特征在于,所述待识别图像为拍摄待识别文本得到的图像,所述字符串表征所述待识别文本中的考号。
5.根据权利要求4所述的方法,其特征在于,所述目标图像识别模型经由如下步骤训练得到:
获取样本集,所述样本集中的样本图像包括至少一个已标记的虚拟样本图像和至少一个已标记的真实样本图像,所述样本图像中的样本区域内包括样本字符串,所述虚拟样本图像为基于所述真实样本图像生成的图像,所述真实样本图像为拍摄样本文本得到的图像;
基于所述虚拟样本图像,训练预先构建的初始图像识别模型,得到预训练的图像识别模型;
基于所述真实样本图像,再次训练所述预训练的图像识别模型,得到所述目标图像识别模型。
6.根据权利要求5所述的方法,其特征在于,所述虚拟样本图像通过如下方式生成:
从所述真实样本图像中分割出单个数字图像,并对所述单个数字图像中的数字进行标记,得到多个样本数字图像;
基于所述样本数字图像,生成样本涂改数字图像;
生成初始图像,并在所述初始图像中确定样本区域,所述初始图像中的像素点的像素值为0;
在所述样本区域内生成单行表格,所述表格包括随机数量的单元格;
对于每个所述单元格,随机选取一个所述样本数字图像叠加到该单元格的区域内;
在各个所述单元格的区域内随机叠加所述样本涂改数字图像,以生成所述样本字符串;
基于各个所述单元格的区域中叠加的样本数字图像的标记结果,对所述样本字符串进行标记,得到所述虚拟样本图像。
7.根据权利要求6所述的方法,其特征在于,所述样本涂改数字图像通过如下方式生成:
生成初始样本图像,所述初始样本图像中的像素点的像素值为0;
在所述初始样本图像中随机生成一条或多条直线;
随机选取一个所述样本数字图像叠加到所述初始样本图像中,得到所述样本涂改数字图像。
8.根据权利要求7所述的方法,其特征在于,所述表格通过如下方式生成:
随机确定待生成的表格的高度、长度以及单元格的数量;
基于所述待生成的表格的高度、长度以及单元格的数量,确定待绘制的直线;
将每个所述待绘制的直线平均分成预设数量个线段,并为每个所述线段生成一个随机数;
若所述线段对应的随机数大于预设阈值,则绘制所述线段,得到所述表格,所述线段的线宽为预设笔画宽度与随机扰动之和。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华云(河北雄安)大数据科技有限公司,未经华云(河北雄安)大数据科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210878112.1/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序