[发明专利]一种图像识别的方法、装置和计算机可读存储介质有效
申请号: | 201910464140.7 | 申请日: | 2019-05-30 |
公开(公告)号: | CN110188755B | 公开(公告)日: | 2021-09-07 |
发明(设计)人: | 钦夏孟;陈露露;韩钧宇;朱胜贤 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06K9/32 | 分类号: | G06K9/32;G06K9/62 |
代理公司: | 北京市铸成律师事务所 11313 | 代理人: | 包莉莉;武晨燕 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 图像 识别 方法 装置 计算机 可读 存储 介质 | ||
本发明实施例提出一种图像识别的方法、装置和计算机可读存储介质,其中方法包括对输入图像进行文本识别,得到所述输入图像的文字信息及其位置;将所述输入图像的文字信息及其位置与预设的结构化模板中的关键特征进行匹配,得到各匹配对;基于各所述匹配对的位置关系,将所述输入图像的文字信息的位置调整为与所述结构化模板相同;从调整后的图像中提取所述文字信息。根据该变换矩阵将输入图像上的文字信息转换成与结构化模板一样的方向和大小,可以解决方向、旋转的问题。
技术领域
本发明涉及互联网技术领域,尤其涉及一种图像识别的方法、装置和计算机可读存储介质。
背景技术
解决基于图像识别的信息结构化的问题主要依靠版式分析,需要高度的定制化,且无法扩展。以图像为身份证识别为例,需要提取姓名、性别、出生日期、住址等关键字段;在获取到文字行的位置和内容后,从中搜索关键词的字符串,根据设定好的位置信息进行字段内容的提取。比如姓名的内容必然在右边,其他字段也如此,这样便可获取所有所需字段的内容。传统的技术方案问题较多,例如:
对于版式规范、字段较少的票证,传统的方案可以解决,但对于版式较复杂、字段较多的票证垂类,传统的技术方案会非常复杂。
传统的技术方案对于输入图像的方向要求非常严格,若有倾斜或者旋转,则搜索到的关键字段内容都会是错误的。
定制化程度过高,对于新增的票证垂类需要重新实现结构化的策略,严重影响了大规模票证垂类信息结构化的速度和效率。
发明内容
本发明实施例提供一种图像识别的方法、装置和计算机可读存储介质,以解决现有技术中的一个或多个技术问题。
第一方面,本发明实施例提供了一种图像识别方法,包括:
对输入图像进行文本识别,得到所述输入图像的文字信息及其位置;
将所述输入图像的文字信息及其位置与预设的结构化模板中的关键特征进行匹配,得到各匹配对;
基于各所述匹配对的位置关系,将所述输入图像的文字信息的位置调整为与所述结构化模板相同;
从调整后的图像中提取所述文字信息。
在一种实施方式中,所述文字信息包括关键特征和文字内容;
将所述输入图像的文字信息及其位置与预设的结构化模板中的关键特征进行匹配,得到各匹配对,包括:
检测所述输入图像的关键特征与所述结构化模板的关键特征是否匹配;
在匹配不唯一的情况下,比较各匹配对中关键特征的位置,以确定所述输入图像的关键特征与所述结构化模板的关键特征的唯一对应关系。
在一种实施方式中,所述结构化模板还包括分别与各关键特征对应的内容项;
基于各所述匹配对的位置关系,将所述输入图像的文字信息的位置调整为与所述结构化模板相同,包括:
在一个所述匹配对中,如果输入图像的关键特征对应文字内容的位置与所述结构化模板的关键特征对应内容项的位置不同,则将所述文字内容的位置调整为所述内容项的位置。
在一种实施方式中,还包括:
在一个所述匹配对中,获取结构化模板的关键特征对应的内容项的位置;
获取输入图像的关键特征对应的文字内容中各字符的位置;
判断所述各字符的位置与所述内容项的位置的重合区域是否超过阈值;
若超过阈值,提取该字符。
在一种实施方式中,还包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910464140.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:图像分割方法和装置、模型训练方法和装置
- 下一篇:产品定位方法
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序