[发明专利]基于OCR的证件识别方法、装置、计算机设备及存储介质在审
申请号: | 201811182144.8 | 申请日: | 2018-10-11 |
公开(公告)号: | CN109492643A | 公开(公告)日: | 2019-03-19 |
发明(设计)人: | 黄泽浩 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06K9/34 | 分类号: | G06K9/34 |
代理公司: | 深圳众鼎专利商标代理事务所(普通合伙) 44325 | 代理人: | 谭果林 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文字区域 证件识别 证件图像 文字类别 计算机设备 存储介质 文字位置 原始证件 证件类型 预处理 图像 定位模型 目标识别 文本信息 预设区域 准确率 裁剪 证件 分类 | ||
1.一种基于OCR的证件识别方法,其特征在于,包括:
获取原始证件图像和证件类型;
对所述原始证件图像进行预处理,获取待识别证件图像;
采用文字定位模型对所述待识别证件图像进行文字定位,获取待识别文字位置;
基于所述待识别文字位置,对所述待识别证件图像进行裁剪,获取待识别文字区域;
采用与所述证件类型相对应的预设区域模板对所述待识别文字区域进行分类,获取所述待识别文字区域对应的文字类别;
基于所述待识别文字区域对应的文字类别,将所述待识别文字区域输入到与所述文字类别相对应的目标识别模型中进行识别,获取待识别文字区域对应的证件文本信息。
2.如权利要求1所述的基于OCR的证件识别方法,其特征在于,所述对所述原始证件图像进行预处理,获取待识别证件图像,包括:
对所述原始证件图像进行灰度化处理,获取灰度图像;
对所述灰度图像进行透视变换处理,获取矫正图像;
对所述矫正图像进行锐化处理,获取锐化图像;
对所述锐化图像进行二值化处理,获取待识别证件图像。
3.如权利要求1所述的基于OCR的证件识别方法,其特征在于,所述区域模板包括二代身份证区域模板和香港身份证区域模板;
所述采用与所述证件类型相对应的预设区域模板对所述待识别文字区域进行分类,获取所述待识别文字区域对应的文字类别,包括:
采用对比坐标方式对所述待识别文字区域进行分类,获取所述待识别文字区域对应的行标识;
若所述证件类型为二代身份证,则基于所述待识别文字区域对应的行标识,采用所述二代身份证区域模板对所述待识别文字区域进行分类,获取所述待识别文字区域对应的文字类别;
若所述证件类型为香港身份证,则基于所述待识别文字区域对应的行标识,采用所述香港身份证区域模板对所述待识别文字区域进行分类,获取所述待识别文字区域对应的文字类别。
4.如权利要求1所述的基于OCR的证件识别方法,其特征在于,所述目标识别模型包括第一专用识别模型、第二专用识别模型和第三专用识别模型;
基于所述待识别文字区域对应的文字类别,将所述待识别文字区域输入到与所述文字类别相对应的目标识别模型中进行识别,获取待识别文字区域对应的证件文本信息,包括:
若所述待识别文字区域对应的文字类别仅包括中文,则将所述待识别文字区域输入到所述第一专用识别模型进行识别,获取所述待识别文字区域对应的证件文本信息;
若所述待识别文字区域对应的文字类别包括数字和/或字母,则将所述待识别文字区域输入到所述第二专用识别模型进行识别,获取所述待识别文字区域对应的证件文本信息;
若所述待识别文字区域对应的文字类别不仅包括中文且还包括字母或者数字,则将所述待识别文字区域输入到所述第三专用识别模型进行识别,获取所述待识别文字区域对应的证件文本信息。
5.如权利要求4所述的基于OCR的证件识别方法,其特征在于,所述基于OCR的证件识别方法还包括:
获取待训练证件图像,对待训练证件图像进行文字定位,获取待训练文字位置;
基于待训练文字位置,对所述待训练证件图像进行裁剪,获取待训练文字图像;
将待训练文字图像输入到卷积神经网络中进行特征提取,获取待训练图像特征;
将待训练图像特征输入到长短时记忆神经网络中进行训练,获取长短时记忆神经网络的输出值;
根据所述长短时记忆神经网络的输出值,采用时序分类算法和模型优化算法更新卷积神经网络-长短时记忆神经网络的网络参数,获取所述第一专用识别模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811182144.8/1.html,转载请声明来源钻瓜专利网。