[发明专利]一种用于配合拍照场景的快速高精度身份证文本识别算法有效
申请号: | 201910311448.8 | 申请日: | 2019-04-18 |
公开(公告)号: | CN110414517B | 公开(公告)日: | 2023-04-07 |
发明(设计)人: | 郭永强;刘铜强;罗俊;熊浩;陈亮;谢运展 | 申请(专利权)人: | 河北神玥软件科技股份有限公司 |
主分类号: | G06V20/62 | 分类号: | G06V20/62;G06V30/146;G06V30/148;G06V30/162;G06V30/164;G06V30/19;G06V10/82;G06N3/04 |
代理公司: | 南京鼎傲知识产权代理事务所(普通合伙) 32327 | 代理人: | 郭元聪 |
地址: | 050000 河北省石家庄市鹿*** | 国省代码: | 河北;13 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 配合 拍照 场景 快速 高精度 身份证 文本 识别 算法 | ||
一种用于配合拍照场景的快速高精度身份证文本识别算法,它涉及一图像处理、模式识别和深度学习技术领域。它包含如下步骤:预处理→字符分割→字符识别;所述预处理的具体步骤为:移动端拍照后上传身份证原始图片,之后存储在云端,并对输入的原始图片进行处理,即将其调整为960×600的固定尺寸,再用gamma算法来进行光照矫正,之后用中值滤波对图片降噪,取平滑的像素区域为3×3,最后用加权平均法将图片由彩色图转为灰度图,转为灰度图后,将图片边缘的像素值设为0(黑色)。采用上述技术方案后,本发明有益效果为:在字符分割中定位头像”提出了基于行或列投影的头像快速定位方法,比传统的基于连通域的头像定位方法具有更低的时间复杂度。
技术领域
本发明涉及图像处理、模式识别和深度学习技术领域,具体涉及一种用于配合拍照场景的快速高精度身份证文本识别算法。
背景技术
作为现代社会中最重要的法定证件之一,身份证包含了一个人的基本身份信息,是办理自身各种业务必不可少的工具。最初,身份证中的文本信息登记多由人手工录入,这不仅耗费人力物力,而且效率低下。近些年来,随着二代身份证的广泛使用,市面上出现了针对二代身份证的专用读卡器,该类读卡器通过与二代身份证内置的射频芯片通信来获取身份证的文本信息。这种方法需要配备专门的硬件设备,其使用范围十分受限。与之相比,利用光学字符识别技术来读取身份证文本信息提供了另一种解决方案。光学字符识别技术是指对待识别物体进行光学成像后,在计算设备上通过算法提取图像中的字符,并识别成相应的文字或数字的过程。光学字符识别技术以光学图像为处理对象,因此凡是有摄像头的设备都可以结合光学字符识别技术来搭建身份证文本信息自动录入系统,在智能手机普及的今天,基于光学字符识别技术的方案显然具有更广的应用场景,其使得个人在移动端便捷录入身份证文本信息成为可能。
目前移动端的手机应用在做身份证图像采集时,多采用配合拍照成像,以减小身份证拍照时不同放置背景对识别效果的影响。配合拍照是指用户在拍照时,手机屏幕界面上会出现一个宽高比与实际身份证相符的方框,用户在拍照时需通过调整拍照高度和角度,以确保从手机屏幕界面上看到的身份证面积正好布满方框,尽量不要超出或不足。本发明也正是针对该种场景开发身份证文本识别算法。经过调研,现有的针对配合拍照场景的身份证文本识别技术主要存在两方面问题:
1、识别精度仍然不够高。身份证文本识别一般包括预处理、字符分割和字符识别三个环节,在字符分割阶段,现有技术缺乏对身份证中字符排布的特殊情况的处理。例如,在实践中发现,经常有人的身份证地址栏中的某一行出现多个上下型汉字,“六”、“花”、“号”等,这种情况极易误导行分割结果,使程序误识别成有两行文字。与之类似,左右型汉字又常会影响到列分割结果。这些情况积少成多,最终大大影响了整体的分割精度;在字符识别阶段,现有技术多采用传统的机器学习方法来识别字符,如模板匹配,支持向量机及浅层卷积神经网络。这些方法皆无法基于大批量数据进行学习,对于复杂多分类问题的处理具有与生俱来的缺陷,在识别身份证中的字符尤其是识别汉字时,精度会下降或不稳定。总之,由于上述提到的原因,现有技术在字符分割和识别方面皆有所欠缺,身份证文本识别的整体精度仍有较大的提升空间。
2、很少考虑算法的运行速度。在实际应用时,速度直接关乎用户体验。在应用于配合拍照场景的身份证文本识别过程中,预处理阶段速度一般较快,算法的时间复杂度主要体现在字符分割和识别方面。其中在字符分割阶段,往往需对身份证图像二值化,现有工作采用的一些算法如bersen法,niblack法、循环阈值法等在实现时包含多重循环嵌套,速度较慢;而在字符识别阶段,现有工作中采用模板匹配法来识别字符需要储存所有汉字的模板,实际运行时不仅匹配过程十分耗时,而且很耗内存;用支持向量机识别字符速度较快,但正如前述所说,该方法识别精度不稳定;采用浅层卷积神经网络识别字符需要进行大量的矩阵间乘法运算,计算复杂度很高。这些因素共同造成了现有的身份证文本识别算法整体运行时间较长。
发明内容
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河北神玥软件科技股份有限公司,未经河北神玥软件科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910311448.8/2.html,转载请声明来源钻瓜专利网。