[发明专利]用于识别图像的方法、装置及电子设备在审
申请号: | 202210878112.1 | 申请日: | 2022-07-25 |
公开(公告)号: | CN115205865A | 公开(公告)日: | 2022-10-18 |
发明(设计)人: | 张亮;王玉芳;王志明;卢肖帆;常洪源 | 申请(专利权)人: | 华云(河北雄安)大数据科技有限公司 |
主分类号: | G06V30/148 | 分类号: | G06V30/148;G06V30/14;G06V30/168;G06V30/18;G06V30/42 |
代理公司: | 北京中知星原知识产权代理事务所(普通合伙) 11868 | 代理人: | 艾变开 |
地址: | 071799 河北省保定市容*** | 国省代码: | 河北;13 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 识别 图像 方法 装置 电子设备 | ||
本发明公开了一种用于识别图像的方法、装置及电子设备。该方法包括:获取待识别图像,待识别图像的预定区域中包括由数字组成的字符串;将待识别图像输入预先训练的目标图像识别模型,得到多通道的输出图像,输出图像中的每个通道对应一个预设数字的置信度预测图;基于置信度预测图,确定预设数字在字符串中的位置;基于预设数字在字符串中的位置,将各预设数字组合成字符串的识别结果。无需对待识别图像进行表格线去除、字符切分等预处理即可识别图像中的数字,可以避免预处理过程中的异常情况导致的识别错误,有助于提高识别的准确度和鲁棒性。
技术领域
本发明涉及计算机技术领域,尤其涉及一种用于识别图像的方法、装置及电子设备。
背景技术
实践中,学生的日常作业、试卷或智学作文的答题卡中会记录有学生的考号,通常采用智能阅卷系统自动识别其中的考号。
相关技术中,识别考号的方法主要包括以下两个步骤,第一步是预处理,从日常作业或试卷的图像中分割出组成考号的数字,例如采用Hough变换、单项链、投影等直线检测方法将数字周围的表格线去除,然后再根据直方图投影或连通区域分析等方法,得到数字所在的图像区域并从图像中分割出各个数字;第二步是对分割得到的单个数字进行识别。由于预处理方法中涉及的规则较复杂,导致预处理过程中容易出现异常情况,进而导致识别错误。
发明内容
有鉴于此,本发明的目的在于提供一种能够提高图像中数字识别准确度和鲁棒性的方法、装置及电子设备。
为达到上述目的,本发明采用以下技术方案:
第一方面,本发明提供了一种用于识别图像的方法,该方法包括:获取待识别图像,待识别图像的预定区域中包括由数字组成的字符串;将待识别图像输入预先训练的目标图像识别模型,得到多通道的输出图像,输出图像中的每个通道对应一个预设数字的置信度预测图;基于置信度预测图,确定预设数字在字符串中的位置;基于预设数字在字符串中的位置,将各预设数字组合成字符串的识别结果。
在一些实施例中,基于置信度预测图,确定预设数字在字符串中的位置,包括:从输出图像中提取出通道对应的置信度预测图;对置信度预测图进行平滑处理和二值化处理,得到处理后的预测图;对处理后的预测图中的预定区域进行连通区域分析,确定处理后的预测图中的预定区域内的连通域;基于连通域的位置,确定通道对应的预设数字在字符串中的位置。
在一些实施例中,输出图像包括11个通道,其中,10个通道分别对应数字0至9的置信度预测图,1个通道对应存在涂改痕迹的数字的置信度预测图。
在一些实施例中,待识别图像为拍摄待识别文本得到的图像,字符串表征待识别文本中的考号。
在一些实施例中,目标图像识别模型经由如下步骤训练得到:获取样本集,样本集中的样本图像包括至少一个已标记的虚拟样本图像和至少一个已标记的真实样本图像,样本图像中的样本区域内包括样本字符串,虚拟样本图像为基于真实样本图像生成的图像,真实样本图像为拍摄样本文本得到的图像;基于虚拟样本图像,训练预先构建的初始图像识别模型,得到预训练的图像识别模型;基于真实样本图像,再次训练预训练的图像识别模型,得到目标图像识别模型。
在一些实施例中,虚拟样本图像通过如下方式生成:从真实样本图像中分割出单个数字图像,并对单个数字图像中的数字进行标记,得到多个样本数字图像;基于样本数字图像,生成样本涂改数字图像;生成初始图像,并在初始图像中确定样本区域,初始图像中的像素点的像素值为0;在样本区域内生成单行表格,表格包括随机数量的单元格;对于每个单元格,随机选取一个样本数字图像叠加到该单元格的区域内;在各个单元格的区域内随机叠加样本涂改数字图像,以生成样本字符串;基于各个单元格的区域中叠加的样本数字图像的标记结果,对样本字符串进行标记,得到虚拟样本图像。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华云(河北雄安)大数据科技有限公司,未经华云(河北雄安)大数据科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210878112.1/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序