[发明专利]一种基于OCR技术的复杂场景下身份证识别方法在审
申请号: | 202010484080.8 | 申请日: | 2020-06-01 |
公开(公告)号: | CN111783757A | 公开(公告)日: | 2020-10-16 |
发明(设计)人: | 骆春波;罗杨;刘翔;胡永杰 | 申请(专利权)人: | 成都科大极智科技有限公司 |
主分类号: | G06K9/20 | 分类号: | G06K9/20;G06K9/34;G06K9/46;G06N3/04;G06N3/08 |
代理公司: | 成都正华专利代理事务所(普通合伙) 51229 | 代理人: | 陈选中 |
地址: | 610041 四川省成都市高新区天*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 ocr 技术 复杂 场景 身份证 识别 方法 | ||
1.一种基于OCR技术的复杂场景下身份证识别方法,其特征在于,包括以下步骤:
S1、通过SIFT算法对现实场景下的身份证图像进行检测和对齐,进而确定现实场景中身份证的位置坐标;
S2、基于获取的身份证位置坐标,通过训练好的深度CNN网络对现实场景中身份证的目标区域进行定位检测,并基于其定位坐标确定待识别文字区域;
S3、通过文字识别网络提取待识别文字区域内的文字信息;
S4、使用最小模糊匹配算法对提取的文字信息进行校正,获得准确的身份证信息,完成身份证识别。
2.根据权利要求1所述的基于OCR技术的复杂场景下身份证识别方法,其特征在于,所述步骤S1具体为:
S11、使用SIFT算法分别对模板身份证和现实场景下的身份证图像进行特征点提取,获得对应的两组特征点;
S12、通过Ransac算法对提取的两组特征点进行对应关系的匹配,并删除匹配错误的特征点,获得现实场景下身份证到身份证模板的透视变换矩阵;
S13、将模板身份证中四个顶点的坐标依次与透视变换矩阵相乘,获得现实场景下身份证的四个顶点坐标,即现实场景中身份证的位置坐标。
3.根据权利要求2所述的基于OCR技术的复杂场景下身份证识别方法,其特征在于,所述步骤S13中,当模板身份对应顶点的坐标为(x,y)时,现实场景中的身份证中对应顶点的坐标(X,Y,Z)为:
式中,M为透视变换矩阵,mij为透视变换矩阵中第i行第j列的值,且i,j=1,2,3。
4.根据权利要求2所述的基于OCR技术的复杂场景下身份证识别方法,其特征在于,所述步骤S2中,所述深度CNN网络包括依次连接的输入层、第一卷积层、第一最大池化层、第二卷积层、第二最大池化层、第三卷积层、第三最大池化层、第四卷积层、第四最大池化层、两个全连接层和输出层;
所述深度CNN网络通过人工标注的身份证图像对其进行训练,所述深度CNN网络的训练参数设置为batch_size为6,nms_thres为0.5,img_size为448和优化器为Adam。
5.根据权利要求1所述的基于OCR技术的复杂场景下身份证识别方法,其特征在于,在所述步骤S2中,通过训练好的深度CNN网络对现实场景中身份证进行检测的目标区域包括姓名位置点、住址位置点、民族位置点、签发机关位置点、有效日期位置点和公安局位置点;
所述步骤S2中,基于目标区域位置坐标确定的待识别文字区域包括姓名内容框、性别内容框、民族内容框、出生内容框、住址内容框、身份证内容框、签发机关内容框和有效日期内容框。
6.根据权利要求5所述的基于OCR技术的复杂场景下身份证识别方法,其特征在于,对于所述住址内容框,将其分割为对应的单行文字区域作为待识别文字区域;
分割方法具体为:
A1、将住址内容框所在区域转化为对应的灰度图像;
A2、将灰度图像进行阈值分割,获得垂直分成三份的单行文字区域;
A3、对每一份单行文字区域进行垂直直方图统计,获得对应的文字存在控制变量ti;
其中,i为分割后的二值化图像变换,i=1,2,3;
A4、对所有ti进行求和统计,得到住址内容框中的单行文字行数T,将其对应的单行文字区域作为待识别文字区域,实现住址内容框的分割。
7.根据权利要求1所述的基于OCR技术的复杂场景下身份证识别方法,其特征在于,所述步骤S3中的文字识别网络包括依次连接的输入层、第一卷积层、第一最大池化层、第二卷积层、第二最大池化层、第三卷积层、第四卷积层、第三最大池化层、第五卷积层、第一批归一化层、第四最大池化层、第二批归一化层、第五最大池化层和第六卷积层;
所述文字识别网络通过第一级常用汉字和第二级常用汉字构建的数据集对其进行训练,所述文字识别网络的训练参数设置为batch_size为6,shuffle为True,优化器为Adadelta,学习率为0.01和迭代次数epoch为10。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都科大极智科技有限公司,未经成都科大极智科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010484080.8/1.html,转载请声明来源钻瓜专利网。