[发明专利]一种基于OCR技术的复杂场景下身份证识别方法在审
申请号: | 202010484080.8 | 申请日: | 2020-06-01 |
公开(公告)号: | CN111783757A | 公开(公告)日: | 2020-10-16 |
发明(设计)人: | 骆春波;罗杨;刘翔;胡永杰 | 申请(专利权)人: | 成都科大极智科技有限公司 |
主分类号: | G06K9/20 | 分类号: | G06K9/20;G06K9/34;G06K9/46;G06N3/04;G06N3/08 |
代理公司: | 成都正华专利代理事务所(普通合伙) 51229 | 代理人: | 陈选中 |
地址: | 610041 四川省成都市高新区天*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 ocr 技术 复杂 场景 身份证 识别 方法 | ||
本发明公开了一种基于OCR技术的复杂场景下身份证识别方法,包括:S1、基于SIFT算法的对身份证的特征点识别,确定现实场景中身份证的位置坐标;S2、基于获取的身份证位置坐标,对现实场景中身份证的目标区域进行定位检测,并确定待识别文字区域;S3、提取待识别文字区域内的文字信息;S4、对提取的文字信息进行校正,获得准确的身份证信息,完成身份证识别。本发明方法解决了在复杂环境如光线较暗、过度曝光、拍摄模糊等情况下身份证的定位和识别问题;通过对识别结果增加字符最小距离校正算法,显著提高识别准确度,且具有一定的结果纠错功能,使识别结果更为可靠。
技术领域
本发明属于身份证识别技术领域,具体涉及一种基于OCR技术的复杂场景下身份证识别方法。
背景技术
随着社会的发展和国家信用体制的不断完善,越来越多的场景需要对身份进行核验,居民身份证实名制在各行各业得到了广泛的应用。如果手动输入身份证号码和姓名等信息,速度慢、用户体验较差,操作人员溶液产生视觉疲劳。为了提高在移动终端上属兔身份证信息的速度和准确性,很多互联网公司都开发了身份证文字识别技术。现有技术采用OCR(光学字符识别)技术对图像、文字信息进行分析和管理,其应用场景往往都是在较为理想的环境下运行。现有方法主要是对身份证扫描包括腐蚀、提取身份证文字区域轮廓,并通过轮廓提取找到图片中身份证号码的文字区域。在实际的使用场景中,依然会存在一些问题:首先,身份证背景存在底纹和防伪反光条干扰,如果出现光照强度不均等客观拍摄环境影响,难以准确定位身份证在图像中的位置;其次,不同地区、不同省份、不同民族的第二代身份证存在字体多种多样、字号不统一、位置变差等问题;最后,人为因素导致的身份证拍摄效果不佳,例如手臂抖动、角度发生倾斜等都可能造成图像模糊。因此,现有的身份证OCR技术,存在以下问题:
1、在复杂的现实场景中,会出现身份证定位准确度不高,目前的身份证倾斜矫正方法主要基于Haar(哈尔特征Haar-like features)的人脸检测技术,检测并提取身份证图像中人像位置和眼睛的坐标,从而确定身份证的位置和旋转角度,对身份证进行倾斜矫正,但是考虑到人脸不可能完全水平或者垂直,这种方法依然可能会产生矫正角度偏差。
2、在识别文字过程中,服务器通过OCR技术获取校正后身份证图像中每一行的文字词语信息并分析词语语义。但是在现实场景中,存在光照不均匀性,导致一些文字无法识别出来,会对后续语义信息的提取造成困难;对一些特殊身份证,例如少数民族身份证,会存在少数民族语言文字,针对每一个民族开发一种识别方法显然是不现实的,目前尚未有很好的解决方法。
发明内容
针对现有技术中的上述不足,本发明提供的基于OCR技术的复杂场景下身份证识别方法解决了上述背景技术中的问题。
为了达到上述发明目的,本发明采用的技术方案为:一种基于OCR技术的复杂场景下身份证识别方法,包括以下步骤:
S1、通过SIFT算法对现实场景下的身份证图像进行检测和对齐,进而确定现实场景中身份证的位置坐标;
S2、基于获取的身份证位置坐标,通过训练好的深度CNN网络对现实场景中身份证的目标区域进行定位检测,并基于其定位坐标确定待识别文字区域;
S3、通过文字识别网络提取待识别文字区域内的文字信息;
S4、使用最小模糊匹配算法对提取的文字信息进行校正,获得准确的身份证信息,完成身份证识别。
进一步地,所述步骤S1具体为:
S11、使用SIFT算法分别对模板身份证和现实场景下的身份证图像进行特征点提取,获得对应的两组特征点;
S12、通过Ransac算法对提取的两组特征点进行对应关系的匹配,并删除匹配错误的特征点,获得现实场景下身份证到身份证模板的透视变换矩阵;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都科大极智科技有限公司,未经成都科大极智科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010484080.8/2.html,转载请声明来源钻瓜专利网。