[发明专利]一种图像识别方法及装置在审

专利信息
申请号: 201610430736.1 申请日: 2016-06-16
公开(公告)号: CN107516095A 公开(公告)日: 2017-12-26
发明(设计)人: 熊诗尧;江文斐;储开颜 申请(专利权)人: 阿里巴巴集团控股有限公司
主分类号: G06K9/20 分类号: G06K9/20;G06K9/32
代理公司: 北京集佳知识产权代理有限公司11227 代理人: 陈莎莎,王宝筠
地址: 英属开曼群岛大开曼*** 国省代码: 暂无信息
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 图像 识别 方法 装置
【说明书】:

技术领域

本申请涉及图像处理领域,尤其是涉及一种图像识别方法及装置。

背景技术

随着图像识别技术的不断发展,对多边形对象的图像识别以获得多边形对象中显示的文本内容等信息得到了越来越广泛的应用。例如,通过对银行卡等矩形卡片进行识别,能够识别出矩形卡片的卡号等文本内容。

目前,对多边形对象进行图像识别时主要采用光学字符识别(Optical Character Recognition,OCR)等图像识别技术。然而,在利用OCR等技术识别多边形对象中显示的信息时,通常对多边形对象在识别区域中的形状、位置等具有一定的要求,否则会导致识别失败。例如对于一张矩形卡片,如果该卡片在识别区域中的位置如图1所示时则能够识别成功;如果该卡片在识别区域的位置如图2所示,也就是当矩形卡片的形状由于拍摄角度而造成透视失真时,则无法利用OCR等技术识别出文本内容。

因此,目前需要解决因多边形对象在识别区域中的位置、形状等不符合识别要求所造成的识别失败。

发明内容

本申请解决的技术问题在于提供一种图像识别方法及装置,通过将多边形对象投影到识别区域,从而解决了因多边形对象在识别区域中的位置、形状等不符合识别要求所造成的识别失败。

为此,本申请解决技术问题的技术方案是:

本申请实施例提供了一种图像识别方法,所述方法包括:

获取待识别图像,所述待识别图像中具有多边形对象;

检测出所述多边形对象的图像信息和位置;

根据所述多边形对象的位置和识别区域的位置,将所述多边形对象的图像信息投影到所述识别区域上,获得投影图像;

利用图像识别技术识别所述投影图像,获得所述多边形对象中具有的信息。

可选的,检测出所述多边形对象的位置包括:检测出所述多边形对象中各个顶点的位置;

根据所述多边形对象的位置和识别区域的位置,将所述多边形对象的图像信息投影到所述识别区域上,获得投影图像,包括:

根据所述多边形对象中各个顶点的位置和所述识别区域中各个顶点的位置,生成从所述多边形对象到所述识别区域的投影矩阵;

根据所述投影矩阵,将所述多边形对象的图像信息投影到所述识别区域上,获得投影图像。

可选的,检测出所述多边形对象中各个顶点的位置,包括:

对所述待识别图像进行边缘检测,检测出所述多边形对象的边缘;

从多边形对象的边缘中检测出直线边;

根据所述直线边,确定出所述多边形对象中各个顶点的位置。

可选的,将所述多边形对象的图像信息投影到所述识别区域上之前,所述方法还包括:

检测所述多边形对象是否为N边形,如果是,则执行所述将所述多边形对象的图像信息投影到所述识别区域上;其中,N为所述识别区域的直线边的数量和。

可选的,所述多边形对象是原始对象发生形变后的对象;所述投影图像为所述待识别图像的纠正图像,所述纠正图像中具有校正后的所述原始对象;

利用图像识别技术识别所述投影图像,获得所述多边形对象中具有的信息包括:

利用图像识别技术识别所述纠正图像,获得所述原始对象中具有的信息。

可选的,获取待识别图像包括:

向用户显示图像,获取用户从显示的图像中选取的图像,作为所述待识别图像;或者,

获取图像采集设备采集的图像,作为所述待识别图像。

可选的,获取待识别图像之前,所述方法还包括:

确定出利用图像识别技术对所述待识别图像识别失败。

本申请实施例提供了一种图像识别装置,所述装置包括:

获取单元,用于获取待识别图像,所述待识别图像中具有多边形对象;

检测单元,用于检测出所述多边形对象的图像信息和位置;

投影单元,用于根据所述多边形对象的位置和识别区域的位置,将所述多边形对象的图像信息投影到所述识别区域上,获得投影图像;

识别单元,用于利用图像识别技术识别所述投影图像,获得所述多边形对象中具有的信息。

可选的,所述检测单元用于检测出所述多边形对象的位置时,所述检测单元具体用于检测出所述多边形对象中各个顶点的位置;

所述投影单元具体用于根据所述多边形对象中各个顶点的位置和所述识别区域中各个顶点的位置,生成从所述多边形对象到所述识别区域的投影矩阵;根据所述投影矩阵,将所述多边形对象的图像信息投影到所述识别区域上,获得投影图像。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201610430736.1/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top