[发明专利]一种图像识别方法及装置在审
申请号: | 201610430736.1 | 申请日: | 2016-06-16 |
公开(公告)号: | CN107516095A | 公开(公告)日: | 2017-12-26 |
发明(设计)人: | 熊诗尧;江文斐;储开颜 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06K9/20 | 分类号: | G06K9/20;G06K9/32 |
代理公司: | 北京集佳知识产权代理有限公司11227 | 代理人: | 陈莎莎,王宝筠 |
地址: | 英属开曼群岛大开曼*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 图像 识别 方法 装置 | ||
技术领域
本申请涉及图像处理领域,尤其是涉及一种图像识别方法及装置。
背景技术
随着图像识别技术的不断发展,对多边形对象的图像识别以获得多边形对象中显示的文本内容等信息得到了越来越广泛的应用。例如,通过对银行卡等矩形卡片进行识别,能够识别出矩形卡片的卡号等文本内容。
目前,对多边形对象进行图像识别时主要采用光学字符识别(Optical Character Recognition,OCR)等图像识别技术。然而,在利用OCR等技术识别多边形对象中显示的信息时,通常对多边形对象在识别区域中的形状、位置等具有一定的要求,否则会导致识别失败。例如对于一张矩形卡片,如果该卡片在识别区域中的位置如图1所示时则能够识别成功;如果该卡片在识别区域的位置如图2所示,也就是当矩形卡片的形状由于拍摄角度而造成透视失真时,则无法利用OCR等技术识别出文本内容。
因此,目前需要解决因多边形对象在识别区域中的位置、形状等不符合识别要求所造成的识别失败。
发明内容
本申请解决的技术问题在于提供一种图像识别方法及装置,通过将多边形对象投影到识别区域,从而解决了因多边形对象在识别区域中的位置、形状等不符合识别要求所造成的识别失败。
为此,本申请解决技术问题的技术方案是:
本申请实施例提供了一种图像识别方法,所述方法包括:
获取待识别图像,所述待识别图像中具有多边形对象;
检测出所述多边形对象的图像信息和位置;
根据所述多边形对象的位置和识别区域的位置,将所述多边形对象的图像信息投影到所述识别区域上,获得投影图像;
利用图像识别技术识别所述投影图像,获得所述多边形对象中具有的信息。
可选的,检测出所述多边形对象的位置包括:检测出所述多边形对象中各个顶点的位置;
根据所述多边形对象的位置和识别区域的位置,将所述多边形对象的图像信息投影到所述识别区域上,获得投影图像,包括:
根据所述多边形对象中各个顶点的位置和所述识别区域中各个顶点的位置,生成从所述多边形对象到所述识别区域的投影矩阵;
根据所述投影矩阵,将所述多边形对象的图像信息投影到所述识别区域上,获得投影图像。
可选的,检测出所述多边形对象中各个顶点的位置,包括:
对所述待识别图像进行边缘检测,检测出所述多边形对象的边缘;
从多边形对象的边缘中检测出直线边;
根据所述直线边,确定出所述多边形对象中各个顶点的位置。
可选的,将所述多边形对象的图像信息投影到所述识别区域上之前,所述方法还包括:
检测所述多边形对象是否为N边形,如果是,则执行所述将所述多边形对象的图像信息投影到所述识别区域上;其中,N为所述识别区域的直线边的数量和。
可选的,所述多边形对象是原始对象发生形变后的对象;所述投影图像为所述待识别图像的纠正图像,所述纠正图像中具有校正后的所述原始对象;
利用图像识别技术识别所述投影图像,获得所述多边形对象中具有的信息包括:
利用图像识别技术识别所述纠正图像,获得所述原始对象中具有的信息。
可选的,获取待识别图像包括:
向用户显示图像,获取用户从显示的图像中选取的图像,作为所述待识别图像;或者,
获取图像采集设备采集的图像,作为所述待识别图像。
可选的,获取待识别图像之前,所述方法还包括:
确定出利用图像识别技术对所述待识别图像识别失败。
本申请实施例提供了一种图像识别装置,所述装置包括:
获取单元,用于获取待识别图像,所述待识别图像中具有多边形对象;
检测单元,用于检测出所述多边形对象的图像信息和位置;
投影单元,用于根据所述多边形对象的位置和识别区域的位置,将所述多边形对象的图像信息投影到所述识别区域上,获得投影图像;
识别单元,用于利用图像识别技术识别所述投影图像,获得所述多边形对象中具有的信息。
可选的,所述检测单元用于检测出所述多边形对象的位置时,所述检测单元具体用于检测出所述多边形对象中各个顶点的位置;
所述投影单元具体用于根据所述多边形对象中各个顶点的位置和所述识别区域中各个顶点的位置,生成从所述多边形对象到所述识别区域的投影矩阵;根据所述投影矩阵,将所述多边形对象的图像信息投影到所述识别区域上,获得投影图像。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610430736.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:使用环绕摄像机系统的并行场景基元检测
- 下一篇:一种字符识别方法及装置
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序