[发明专利]用于识别文字的方法和装置有效
申请号: | 202010097553.9 | 申请日: | 2020-02-17 |
公开(公告)号: | CN111291761B | 公开(公告)日: | 2023-08-04 |
发明(设计)人: | 冯博豪;陈兴波;张小帅 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06V20/62 | 分类号: | G06V20/62;G06V30/148;G06V30/18;G06V30/19 |
代理公司: | 北京英赛嘉华知识产权代理有限责任公司 11204 | 代理人: | 王达佐;马晓亚 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 识别 文字 方法 装置 | ||
本公开的实施例公开了用于识别文字的方法和装置。该方法的一具体实施方式包括:获取目标区域的图像,目标区域为表面上存在凹凸结构且凹凸结构形成待识别文字的区域,图像为采用平行光以预设角度照射于目标区域时所采集的图像;将图像输入预训练的目标特征提取模型,获得对应图像中的待识别文字的特征信息;将对应图像中的待识别文字的特征信息输入预训练的目标文字识别模型,获得对应图像的目标识别结果;基于对应图像的目标识别结果,确定图像中的文字。基于平行光以预设角度照射于目标区域时所采集的图像对待识别文字进行识别,并基于对应图像的识别结果确定图像中的文字,实现了对凹凸结构形成的文字的自动识别,可以提高这类文字的识别效率。
技术领域
本公开的实施例涉及计算机技术领域,具体涉及图像识别技术领域,尤其涉及用于识别文字的和装置。
背景技术
在日常生活中,很多物体表面存在由凹凸结构形成的文字,比如奖牌上面的文字,机械手表上面的刻度,圆形石头上面的浮雕,以及轮胎上面的标识。以轮胎上的标识为例,这类文字记载了轮胎在制造过程中的关键信息,例如在轮胎侧面记录了轮胎的大部分重要信息,包括生产日期、硫化机台号、轮胎型号及轮胎品牌等,翻新、跟踪轮胎的使用时都需要提取这些关键信息。
但是现阶段,尚没有针对凹凸结构形成的文字的智能识别技术,只能由人工录入。当凹凸结构形成的文字较多时,手工录入的方式难以保证准确率,而且录入效率低。
发明内容
本公开的实施例提出了用于识别文字的方法和装置。
第一方面,本公开的实施例提供了一种用于识别文字的方法,该方法包括:获取目标区域的图像,目标区域为表面上存在凹凸结构且凹凸结构形成待识别文字的区域,图像为采用平行光以预设角度照射于目标区域时所采集的图像;将图像输入预训练的目标特征提取模型,获得对应图像中的待识别文字的特征信息;将对应图像中的待识别文字的特征信息输入预训练的目标文字识别模型,获得对应图像的目标识别结果;基于对应图像的目标识别结果,确定图像中的文字。
在一些实施例中,获取目标区域的图像,包括:分别获取平行光以不同的预设角度照射于目标区域所形成的图像。
在一些实施例中,基于对应图像的目标识别结果,确定图像中的文字,包括:基于对应图像的目标识别结果中重复率最高的目标识别结果,确定图像中的文字。
在一些实施例中,将图像输入预训练的目标特征提取模型,获得对应图像中的待识别文字的特征信息,包括:将图像输入目标特征提取模型中的特征提取网络,获得图像中每个像素点的特征值,特征值用于表征该像素点是否存在待识别文字;以及在目标特征提取模型中,执行以下操作:基于特征值,确定待识别文字在图像中的位置;基于待识别文字在图像中的位置,对图像进行实例分割,得到实例分割图和实例分割参数,实例分割参数用于表征对应的实例分割图的准确率;基于实例分割图,确定分类概率值,分类概率值用于表征实例分割图为文字图像的概率;基于与实例分割图对应的实例分割参数和分类概率值的加权和,将符合预设条件的实例分割图的集合确定为待识别文字的特征信息。
在一些实施例中,在基于目标识别结果,确定图像中的文字之前还包括:基于预设词库,对目标识别结果进行修正。
在一些实施例中,在基于目标识别结果,确定图像中的文字之后还包括:响应于接收到针对图像中的文字的修改指令,将修改后的文字确定为图像中的文字。
第二方面,本公开的实施例提供了一种用于识别文字的装置,装置包括:获取单元,被配置成获取目标区域的图像,目标区域为表面上存在凹凸结构且凹凸结构形成待识别文字的区域,图像为采用平行光以预设角度照射于目标区域时所采集的图像;特征单元,被配置成将图像输入预训练的目标特征提取模型,获得对应图像中的待识别文字的特征信息;识别单元,被配置成将对应图像中的待识别文字的特征信息输入预训练的目标文字识别模型,获得对应图像的目标识别结果;确定单元,被配置成基于对应图像的目标识别结果,确定图像中的文字。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010097553.9/2.html,转载请声明来源钻瓜专利网。