[发明专利]基于OCR技术的身份证识别方法、存储介质及装置在审
申请号: | 202211659284.6 | 申请日: | 2022-12-23 |
公开(公告)号: | CN115641594A | 公开(公告)日: | 2023-01-24 |
发明(设计)人: | 王先来 | 申请(专利权)人: | 广州佰锐网络科技有限公司 |
主分类号: | G06V30/18 | 分类号: | G06V30/18;G06V10/44;G06V10/764;G06V30/19 |
代理公司: | 广州永华专利代理有限公司 44478 | 代理人: | 陈洁 |
地址: | 510665 广东省广州市天河*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 ocr 技术 身份证 识别 方法 存储 介质 装置 | ||
1.一种基于OCR技术的身份证识别方法,其特征是,包括以下步骤:
A.获取含有身份证图像的待识别图像,从待识别图像中截取身份证图像;
B.采用渐进尺度扩张算法识别出上述身份证图像中的各个文本行的位置坐标;
C.根据各个文本行的位置坐标,通过文本识别算法识别出上述身份证图像中各个文本框的文本;
D.采用版面分析算法识别出上述身份证图像中的多个身份证信息要素以及各要素的位置坐标;
E.根据上述身份证图像中各个身份证信息要素的位置坐标以及各个文本框的位置坐标,将各个文本框的文本与对应的身份证信息要素进行匹配,输出各个身份证信息要素所匹配的文本。
2.如权利要求1所述的基于OCR技术的身份证识别方法,其特征是:
步骤A中具体是通过目标检测模型从待识别图像中截取身份证图像,目标检测模型包括用于提取待识别图像的图像特征的主干网络、对图像特征进行上采样的FPN网络、对图像特征进行下采样的PAN网络以及用于进行最优解筛选的NMS算法;
目标检测模型从待识别图像中截取身份证图像的过程如下:
A1.接收所输入的身份证图像;
A2.通过主干网络提取该身份证图像的图像特征;
A3.通过FPN网络和PAN网络对所提取的图像特征进行上、下采样后输出预测特征图;
A4.通过NMS算法对该预测特征图进行最优解筛选,输出身份证图像的位置坐标和身份证的面向信息;
A5.根据身份证图像的位置坐标从待识别图像中截取身份证图像。
3.如权利要求1所述的基于OCR技术的身份证识别方法,其特征是,步骤B具体地,提取上述身份证图像的图像特征,通过FPN网络对该图像特征进行上采样后输出预测特征图,然后采用渐进尺度扩张算法对该预测特征图进行文本检测,从而识别出上述身份证图像中的各个文本框的位置坐标。
4.如权利要求1所述的基于OCR技术的身份证识别方法,其特征是,步骤C中,在通过文本识别算法识别出上述身份证图像中各个文本框的文本之前,执行倾斜文本处理步骤:随机取一个文本框的位置坐标,计算该文本框的倾斜角度,若文本框的倾斜角度大于预设角度,则使身份证图像绕其中心进行旋转,直至文本框旋转至水平。
5.如权利要求1所述的基于OCR技术的身份证识别方法,其特征是,步骤E具体地:
E1.对每个身份证信息要素执行如下文本匹配步骤:
——E11.根据该身份证信息要素的位置坐标以及各个尚未匹配的文本框的位置坐标,为该身份证信息要素匹配对应的文本框的文本;
——E12.判断该身份证信息要素所匹配的文本是否符合该身份证信息要素的标准格式:
——E13.若否,则将该身份证信息要素所匹配的文本与在身份证图像中和该文本位置相邻的文本进行合并,以合并后的文本作为该身份证信息要素所匹配的文本并再次执行步骤E12;
——E14.若是,则匹配完成;
E2.输出各个身份证信息要素所匹配到的文本。
6.如权利要求5所述的基于OCR技术的身份证识别方法,其特征是,步骤E2中,在输出各个身份证信息要素所匹配到的文本之前执行文本校正步骤:根据各个身份证信息要素的固定字段,对该身份证信息要素所匹配到的文本进行校正。
7.如权利要求1所述的基于OCR技术的身份证识别方法,其特征是,步骤A具体是从视频流中截取多张不同帧的含有同一个身份证图像的待选图像,采用图像质量评价模型对每张待选图像进行图像质量评分,取评分最高者作为待识别图像。
8.一种计算机可读存储介质,其上存储有可执行的计算机程序,其特征是,该计算机程序被执行时实现如权利要求1至7当中任一项所述的基于OCR技术的身份证识别方法。
9.一种基于OCR技术的身份证识别装置,包括用于拍摄身份证图像的摄像头、连接该摄像头的处理器以及连接该处理器的计算机可读存储介质,其特征是,该计算机可读存储介质是如权利要求8所述的计算机可读存储介质,该处理器可执行该计算机可读存储介质中的计算机程序,从而实现如权利要求1至7当中任一项所述的基于OCR技术的身份证识别方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州佰锐网络科技有限公司,未经广州佰锐网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211659284.6/1.html,转载请声明来源钻瓜专利网。