[发明专利]图像识别方法和装置有效
申请号: | 201610675805.5 | 申请日: | 2016-08-16 |
公开(公告)号: | CN106326888B | 公开(公告)日: | 2022-08-16 |
发明(设计)人: | 周舒畅;孙霏;姚聪;敖翔;周昕宇;何蔚然;印奇 | 申请(专利权)人: | 北京旷视科技有限公司;北京迈格威科技有限公司 |
主分类号: | G06V30/14 | 分类号: | G06V30/14;G06V30/146 |
代理公司: | 北京睿邦知识产权代理事务所(普通合伙) 11481 | 代理人: | 徐丁峰;戴亚南 |
地址: | 100190 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 识别 方法 装置 | ||
本发明的实施例提供了一种图像识别方法和装置。该图像识别方法包括:从待识别图像中提取包含待识别对象的图像块;对图像块中的文字进行文字识别,以获得初级识别结果;获取描述文件,描述文件包括用于指示图像块中的文字需要符合的规则要求的约束信息;将图像块的坐标系与描述文件中规定的图像坐标系对齐;以及利用描述文件中的至少部分约束信息对初级识别结果进行修正,以获得最终识别结果。上述图像识别方法和装置,在从待识别图像中识别文字信息时,利用获取的描述文件修正文字识别结果,可以达到提高文字识别准确度和文字识别速度的效果。
技术领域
本发明涉及计算机领域,更具体地涉及一种图像识别方法和装置。
背景技术
在很多领域,需要对诸如身份证的证照或类似的具有一定文字排布规则的非证照对象中的文字进行识别。以证照为例,典型的证照识别流程是:用户提供一张证照图像,识别引擎从证照图像中提取文字信息并输出给用户。
以上流程的缺陷在于:系统无法利用关于待识别证照的先验知识,特别是关于各个域(包含文字的区域)的先验知识来改进识别结果。例如按法律规定,中国居民身份证的背面的签发机关只能是县级公安机关。但是在现有流程中,无法将县级公安机关的列表提供给识别引擎,从而无法利用这一信息。
发明内容
考虑到上述问题而提出了本发明。本发明提供了一种图像识别方法和装置。
根据本发明一方面,提供了一种图像识别方法,包括:从待识别图像中提取包含待识别对象的图像块;对所述图像块中的文字进行文字识别,以获得初级识别结果;获取描述文件,所述描述文件包括用于指示所述图像块中的文字需要符合的规则要求的约束信息;将所述图像块的坐标系与所述描述文件中规定的图像坐标系对齐;以及利用所述描述文件中的至少部分约束信息对所述初级识别结果进行修正,以获得最终识别结果。
示例性地,在所述对所述图像块中的文字进行文字识别之后,所述图像识别方法进一步包括:输出所述初级识别结果,以供用户查看。
示例性地,在所述利用所述描述文件中的至少部分约束信息对所述初级识别结果进行修正之前,所述图像识别方法进一步包括:接收用户修正指令;以及根据所述用户修正指令从所述描述文件中选择所述至少部分约束信息。
示例性地,在所述接收用户修正指令之前,所述图像识别方法进一步包括:提供关于所述描述文件中的所有约束信息的标识信息,以供用户选择,其中,所述用户修正指令包括所述用户输入的、针对关于所述至少部分约束信息的标识信息的选择指令。
示例性地,所述获取描述文件包括:接收用户输入的初始文件;以及对所述初始文件进行解析,以获得所述描述文件。
示例性地,在所述将所述图像块的坐标系与所述描述文件中规定的图像坐标系对齐之前,所述图像识别方法进一步包括:检查所述描述文件是否存在格式错误,如果存在格式错误,则发出提醒信息。
示例性地,所述获取描述文件包括:根据所述待识别对象的类别从预先存储在存储器中的描述文件集合中选择所述描述文件。
示例性地,所述图像块中的文字分布于一个或多个域中,所述约束信息包括所述一个或多个域中的每一个的域名、坐标和属性信息。
示例性地,所述属性信息包括用于指向属性文档的指示信息,所述属性文档包括其所对应的域中可能出现的所有文字。
示例性地,所述图像识别方法还包括:接收用户输入的所述属性文档或获取预先存储在存储器中的所述属性文档。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京旷视科技有限公司;北京迈格威科技有限公司,未经北京旷视科技有限公司;北京迈格威科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610675805.5/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序