[发明专利]图像识别方法和装置有效
申请号: | 201610675805.5 | 申请日: | 2016-08-16 |
公开(公告)号: | CN106326888B | 公开(公告)日: | 2022-08-16 |
发明(设计)人: | 周舒畅;孙霏;姚聪;敖翔;周昕宇;何蔚然;印奇 | 申请(专利权)人: | 北京旷视科技有限公司;北京迈格威科技有限公司 |
主分类号: | G06V30/14 | 分类号: | G06V30/14;G06V30/146 |
代理公司: | 北京睿邦知识产权代理事务所(普通合伙) 11481 | 代理人: | 徐丁峰;戴亚南 |
地址: | 100190 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 识别 方法 装置 | ||
1.一种图像识别方法,包括:
从待识别图像中提取包含待识别对象的图像块;
对所述图像块中的文字进行文字识别,以获得初级识别结果;
获取描述文件,所述描述文件包括用于指示所述图像块中的文字需要符合的规则要求的约束信息,其中,所述图像块中的文字分布于一个或多个域中,所述约束信息包括所述一个或多个域中的每一个的域名、坐标和属性信息;
将所述图像块的坐标系与所述描述文件中规定的图像坐标系对齐;
根据所述图像块的坐标与所述描述文件中的各个域的坐标将所述图像块中的子图像块与所述描述文件中的域对应起来;以及
利用所述描述文件中的与至少部分域相对应的至少部分约束信息对所述初级识别结果中与所述至少部分域相对应的文字信息进行修正,以获得最终识别结果;
其中,在所述利用所述描述文件中的至少部分约束信息对所述初级识别结果进行修正之前,所述图像识别方法进一步包括:
接收用户修正指令;以及
根据所述用户修正指令从所述描述文件中选择与所述至少部分域相对应的所述至少部分约束信息。
2.如权利要求1所述的图像识别方法,其中,在所述对所述图像块中的文字进行文字识别之后,所述图像识别方法进一步包括:
输出所述初级识别结果,以供用户查看。
3.如权利要求1或2所述的图像识别方法,其中,在所述接收用户修正指令之前,所述图像识别方法进一步包括:
提供关于所述描述文件中的所有约束信息的标识信息,以供用户选择,
其中,所述用户修正指令包括所述用户输入的、针对关于与所述至少部分域相对应的所述至少部分约束信息的标识信息的选择指令。
4.如权利要求1所述的图像识别方法,其中,所述获取描述文件包括:
接收用户输入的初始文件;以及
对所述初始文件进行解析,以获得所述描述文件。
5.如权利要求4所述的图像识别方法,其中,在所述将所述图像块的坐标系与所述描述文件中规定的图像坐标系对齐之前,所述图像识别方法进一步包括:
检查所述描述文件是否存在格式错误,如果存在格式错误,则发出提醒信息。
6.如权利要求1所述的图像识别方法,其中,所述获取描述文件包括:
根据所述待识别对象的类别从预先存储在存储器中的描述文件集合中选择所述描述文件。
7.如权利要求1所述的图像识别方法,其中,所述属性信息包括用于指向属性文档的指示信息,所述属性文档包括其所对应的域中可能出现的所有文字。
8.如权利要求7所述的图像识别方法,其中,所述图像识别方法还包括:
接收用户输入的所述属性文档或获取预先存储在存储器中的所述属性文档。
9.一种图像识别装置,包括:
提取模块,用于从待识别图像中提取包含待识别对象的图像块;
文字识别模块,用于对所述图像块中的文字进行文字识别,以获得初级识别结果;
文件获取模块,用于获取描述文件,所述描述文件包括用于指示所述图像块中的文字需要符合的规则要求的约束信息,其中,所述图像块中的文字分布于一个或多个域中,所述约束信息包括所述一个或多个域中的每一个的域名、坐标和属性信息;
对齐模块,用于将所述图像块的坐标系与所述描述文件中规定的图像坐标系对齐;
对应模块,用于根据所述图像块的坐标与所述描述文件中的各个域的坐标将所述图像块中的子图像块与所述描述文件中的域对应起来;以及
修正模块,用于利用所述描述文件中的与至少部分域相对应的至少部分约束信息对所述初级识别结果中与所述至少部分域相对应的文字信息进行修正,以获得最终识别结果;
其中,所述图像识别装置进一步包括:
指令接收模块,用于接收用户修正指令;以及
选择模块,用于根据所述用户修正指令从所述描述文件中选择与所述至少部分域相对应的所述至少部分约束信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京旷视科技有限公司;北京迈格威科技有限公司,未经北京旷视科技有限公司;北京迈格威科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610675805.5/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序