[发明专利]基于深度学习的身份证图像文本识别方法及装置有效
申请号: | 201810813704.9 | 申请日: | 2018-07-23 |
公开(公告)号: | CN109034050B | 公开(公告)日: | 2022-05-03 |
发明(设计)人: | 冯昊楠;朴安妮;张玉双 | 申请(专利权)人: | 顺丰科技有限公司 |
主分类号: | G06V30/40 | 分类号: | G06V30/40;G06V10/22;G06V30/10 |
代理公司: | 北京志霖恒远知识产权代理事务所(普通合伙) 11435 | 代理人: | 郭栋梁 |
地址: | 518061 广东省深圳市南山区学府路(以南)*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 深度 学习 身份证 图像 文本 识别 方法 装置 | ||
1.一种基于深度学习的身份证图像文本识别方法,其特征在于,包括:
对获取的第一图像进行图像预处理;
将经过预处理后的所述第一图像输入第一模型,所述第一模型对所述第一图像进行各目标字段区域检测,获得所述第一图像中各目标字段区域的位置信息;
根据所述位置信息截取所述第一图像中各目标字段区域的图像作为第二图像;
将所述第二图像输入第二模型,所述第二模型对所述第二图像进行目标字段识别,获得所述第二图像中目标字段的文本信息;
所述对获取的第一图像进行图像预处理包括:
对所述第一图像进行一次边缘检测,若无法检测到所述第一图像的边缘,则提示重新输入第一图像,否则,对所述第一图像进行扭转;
将扭转后的所述第一图像输入第三模型中,所述第三模型对所述扭转后的第一图像进行二次边缘检测,若无法检测到所述第一图像的边缘,则提示重新输入第一图像,否则,
识别所述第一图像为身份证的正面或者反面,若无法识别所述第一图像为身份证的正面或者反面 ,则提示重新输入第一图像。
2.根据权利要求1所述的基于深度学习的身份证图像文本识别方法,其特征在于,包括检验所述各目标字段区域的位置信息,具体的,根据所述识别第一图像为身份证的正面或者反面 的结果,比较预设的所述身份证正面或者反面的不同目标字段间的位置关系和所述位置信息是否对应,若不对应,则提示重新输入第一图像。
3.根据权利要求1所述的基于深度学习的身份证图像文本识别方法,其特征在于,包括训练所述第一模型,具体的,对所述第一图像进行以下操作之一或者组合获得第三图像:
随机多角度旋转、高斯模糊、均值模糊、翻转、随机噪点和光强变化,
使用所述第三图像训练所述第一模型。
4.根据权利要求1所述的基于深度学习的身份证图像文本识别方法,其特征在于,包括训练所述第二模型,具体的,将高频姓名字库仿照身份证背景和字体生成第四图像,使用所述第四图像训练所述第二模型。
5.根据权利要求4所述的基于深度学习的身份证图像文本识别方法,其特征在于,对所述第四图像进行以下操作之一或者组合获得第五图像:
随机多角度旋转、高斯模糊、均值模糊、翻转、随机噪点和光强变化,
使用所述第五图像训练所述第二模型。
6.根据权利要求1所述的基于深度学习的身份证图像文本识别方法,其特征在于,包括存储所述文本信息和与所述文本信息对应的第二图像。
7.一种基于深度学习的身份证图像文本识别装置,其特征在于,包括:
图像预处理模块:用于对获取的第一图像进行图像预处理;
文本检测模块:用于将经过预处理后的所述第一图像输入第一模型,所述第一模型对所述第一图像进行各目标字段区域检测,获得所述第一图像中各目标字段区域的位置信息;
图像截取模块:用于根据所述位置信息截取所述第一图像中各目标字段区域的图像作为第二图像;
文本识别模块:用于将所述第二图像输入第二模型,所述第二模型对所述第二图像进行目标字段识别,获得所述第二图像中目标字段的文本信息;
所述图像预处理模块:还用于对所述第一图像进行边一次缘检测,若无法检测到所述第一图像的边缘,则提示重新输入第一图像,否则,对所述第一图像进行扭转;
将扭转后的所述第一图像输入第三模型中,所述第三模型对所述扭转后的第一图像进行二次边缘检测,若无法检测到所述第一图像的边缘,则提示重新输入第一图像,否则,
识别所述第一图像为身份证的正面或者反面,若无法识别所述第一图像为身份证的正面或者反面 ,则提示重新输入第一图像。
8.根据权利要求7所述的基于深度学习的身份证图像文本识别装置,其特征在于,包括检验模块:用于检验所述各目标字段区域的位置信息,具体的,根据所述识别第一图像为身份证的正面或者反面 的结果,比较预设的所述身份证正面或者反面的不同目标字段间的位置关系和所述位置信息是否对应,若不对应,则提示重新输入第一图像。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于顺丰科技有限公司,未经顺丰科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810813704.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:跳舞视频的识别方法及装置
- 下一篇:人眼定位方法