[发明专利]图像识别方法、装置、设备及存储介质在审
申请号: | 202010873733.1 | 申请日: | 2020-08-26 |
公开(公告)号: | CN112001331A | 公开(公告)日: | 2020-11-27 |
发明(设计)人: | 高万顺 | 申请(专利权)人: | 上海高德威智能交通系统有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62 |
代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 谢冬寒 |
地址: | 201821 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 识别 方法 装置 设备 存储 介质 | ||
本申请实施例公开了一种图像识别方法、装置、设备及存储介质,属于图像处理领域。所述方法包括:获取第一图像对应的模板图像,模板图像包括识别框;对第一图像进行字符识别,以确定第一图像中的第一文本框;对第一图像中的第一文本框与模板图像中的识别框进行点集配准,得到第一图像与模板图像之间的识别框配对关系;基于该识别框对应关系,确定第一图像的结构化识别结果。这种图像识别方式,无需在模板图像中设置锚点框,可以简化模板图像的设置操作,减少模板设置工作量。而且,在存在文本内容相同的多个识别框,或者在没有锚点框的情况下,也能够准确确定识别框配对关系,进而得到结构化识别结果,扩展了图像识别场景。
技术领域
本申请涉及图像处理领域,特别涉及一种图像识别方法、装置、设备及存储介质。
背景技术
在很多场景中,需要对票据类图像、卡证类图像或自定义模板图像等进行识别,以将这些图像中相关位置的文本识别出来。比如,需要对身份证图像进行自动识别,以得到身份信息。
目前,一般需要用户预先为待识别图像设置对应的模板图像,并在模板图像中设置锚点框和识别框,以及为锚点框和识别框设置对应的文本属性,然后根据模板图像对待识别图像进行识别。其中,锚点框是指固定文本内容所在的文本框,如姓名、性别等标题性的文本框。识别框是指待提取文本内容的文本框,如具体姓名或性别所在的文本框。文本属性用于指示文本框中文本内容的类型,如姓名或性别等。对于待识别的第一图像,在根据模板图像对第一图像进行识别时,可以先对第一图像进行字符识别,得到第一图像中的文本框。然后,基于文本框中的文本内容,对第一图像中的文本框与模板图像中的锚点框进行匹配,并将第一图像中与模板图像的锚点框的文本内容相同的文本框作为锚点框,得到第一图像与模板图像之间的锚点框匹配关系。以及基于文本框中的文本内容,对第一图像中的文本框与模板图像中的识别框进行匹配,并将第一图像中与模板图像的识别框的文本内容相同的文本框作为识别框,得到第一图像与模板图像之间的识别框匹配关系。再根据锚点框匹配关系,对第一图像进行透视变换,得到与模板图像相匹配的第二图像。最后,基于锚点框匹配关系和识别框匹配关系,确定第二图像的结构化识别结果,该结构化识别结果包括第二图像中的识别框的文本内容和文本属性。
由于需要由用户预先为模板图像设置锚点框和识别框,因此具有一定的操作难度和模板设置工作量。而且,该图像识别方法具有一定的局限性。比如,在待识别图像或模板图像中没有锚点框的情况下,无法进行识别。或者,如果待识别图像或模板图像中出现了文本内容相同的多个识别框,则仅根据文本内容可能无法准确匹配识别框,即无法准确确定待识别图像和模板图像之间的识别框匹配关系,进而影响图像识别结果,导致图像识别准确度较低。
发明内容
本申请实施例提供了一种图像识别方法、装置、设备及存储介质,可以用于解决相关技术中存在的图像识别方法具有一定的局限性,识别准确度较低的问题。所述技术方案如下:
一方面,提供了一种图像识别方法,所述方法包括:
获取第一图像对应的模板图像,所述模板图像包括识别框,所述识别框具有对应的文本属性;
对所述第一图像进行字符识别,以确定所述第一图像中的第一文本框;
对所述第一图像中的第一文本框与所述模板图像中的识别框进行点集配准,并将所述第一图像中与所述模板图像中的识别框相互配准的第一文本框作为识别框,得到识别框配对关系,所述识别框配对关系包括所述第一图像中的识别框与所述模板图像中的识别框之间的一一配对关系;
基于所述识别框对应关系,确定所述第一图像的结构化识别结果,所述结构化识别结果包括所述第一图像中的识别框的文本内容和文本属性。
可选地,所述基于所述识别框对应关系,确定所述第一图像的结构化识别结果,包括:
基于所述识别框配对关系,对所述第一图像进行透视变换,得到与所述模板图像匹配的第二图像;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海高德威智能交通系统有限公司,未经上海高德威智能交通系统有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010873733.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:吊钩自动竖立的方法及成型设备
- 下一篇:一种用于发动机的无气源辅助的燃烧器
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序