[发明专利]一种身份证识别方法、装置、设备及存储介质在审
申请号: | 202010826150.3 | 申请日: | 2020-08-17 |
公开(公告)号: | CN111950554A | 公开(公告)日: | 2020-11-17 |
发明(设计)人: | 方宗 | 申请(专利权)人: | 深圳市丰巢网络技术有限公司 |
主分类号: | G06K9/32 | 分类号: | G06K9/32;G06K9/34 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 潘登 |
地址: | 518000 广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 身份证 识别 方法 装置 设备 存储 介质 | ||
本发明实施例公开了一种身份证识别方法、装置、设备及存储介质。该方法包括:获取待处理的身份证图片;将待处理的身份证图片进行旋转角度检测,校正待处理的身份证图片的旋转角度得到第一身份证图片;将第一身份证图片进行透视变换,得到第二身份证图片;过滤不符合预设类型的第二身份证图片,得到第三身份证图片;通过模板匹配截取第三身份证图片的预设文本区域,并进行文本识别。通过多个轻量级模型对待处理身份证图片进行多种变换处理,并截取预设的文本区域进行文本识别,解决传统方法中文本定位精度低,无法准确识别文本,而深度学习方法的文本检测速度较慢的问题,实现快速精准定位身份证图片上的文本区域并进行识别的效果。
技术领域
本发明实施例涉及图像处理技术,尤其涉及一种身份证识别方法、装置、设备及存储介质。
背景技术
随着网络技术的发展,一些应用程序在用户进行实名认证时,要求用户上传身份证照片,具体包括身份证正面照片和身份证反面照片。因此需要判别身份证的正反面,以及识别身份证上的文字内容,而识别的准确性和识别速度直接影响着应用程序后处理的逻辑可靠性和用于体验感。
目前已有的身份证识别方法包括传统方法和深度学习方法,传统方法需要通过插值去模糊、离散余弦变换去噪、纹理阈值分割、截取文本区域和文本识别;深度学习方法需要经过图片预处理、文本检测、截取文本区域、文本识别和文本校正等步骤。
传统方法定位文本的精度较低,无法准确识别复杂环境下的身份证图片内容,深度学习方法使用文本检测方法速度慢,增加了应用程序处理的时间,用户体验较差。
发明内容
本发明提供一种身份证识别方法、装置、设备及存储介质,以实现快速准确识别身份证图片的文本信息。
第一方面,本发明实施例提供了一种身份证识别方法,包括:
获取待处理的身份证图片;
将所述待处理的身份证图片进行旋转角度检测,校正所述待处理的身份证图片的旋转角度得到第一身份证图片;
将所述第一身份证图片进行透视变换,得到第二身份证图片;
过滤不符合预设类型的所述第二身份证图片,得到第三身份证图片;
通过模板匹配截取所述第三身份证图片的预设文本区域,并进行文本识别。
可选的,在所述将所述第一身份证图片进行透视变换,得到第二身份证图片之前,还包括:
检测所述第一身份证图片的四个顶点,并根据顶点计算透视变换矩阵。
可选的,所述检测所述第一身份证图片的四个顶点,并根据顶点计算透视变换矩阵,包括:
检测所述第一身份证图片的四个顶点,获取所述四个顶点的位置坐标;
获取预设透视变换后的目标图片的顶点的位置坐标;
根据所述四个顶点的位置坐标和所述目标图片的顶点的位置坐标计算透视变换矩阵。
可选的,在所述截取所述第三身份证图片的预设文本区域,并进行文本识别之后,还包括:
对识别后的文本进行文本校正。
第二方面,本发明实施例还提供了一种身份证识别装置,包括:
图片获取模块,用于获取待处理的身份证图片;
角度校正模块,用于将所述待处理的身份证图片进行旋转角度检测,校正所述待处理的身份证图片的旋转角度得到第一身份证图片;
透视变化模块,用于将所述第一身份证图片进行透视变换,得到第二身份证图片;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市丰巢网络技术有限公司,未经深圳市丰巢网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010826150.3/2.html,转载请声明来源钻瓜专利网。