[发明专利]基于深度学习的自然场景证件图像文字识别方法有效

申请号：	201910630252.5	申请日：	2019-07-12
公开（公告）号：	CN110532855B	公开（公告）日：	2022-03-18
发明（设计）人：	王晓甜;吴嘉诚;林亚静;石光明;齐飞;林杰	申请（专利权）人：	西安电子科技大学
主分类号：	G06V30/413	分类号：	G06V30/413;G06V30/146;G06V30/148;G06V10/82;G06V30/10;G06N3/04;G06N3/08
代理公司：	陕西电子工业专利中心 61205	代理人：	田文英;王品华
地址：	710071 陕***	国省代码：	陕西;61
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	基于深度学习自然场景证件图像文字识别方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明公开了一种基于深度学习的自然场景证件图像文字识别方法，实现的步骤为：(1)构建图像特征提取模块；(2)构建文字前景预测模块；(3)构建文字区域定位模块；(4)组成文字定位网络；(5)构建字符特征提取模块；(6)组成文字识别网络；(7)构建文字定位数据集；(8)构建文字识别数据集；(9)训练文字定位网络；(10)训练文字识别网络；(11)识别证件图像中的文字。本发明克服了现有证件图像文字识别技术对拍摄环境要求苛刻，在复杂场景中识别准确率低的问题，使得本发明能够在任意自然场景下都能精准的识别证件图像中的文字。

技术领域

本发明属于图像文字处理技术领域，更进一步涉及图像文字识别技术领域中的一种基于深度学习的自然场景证件图像中的文字识别方法。本发明可用于对自然场景下(例如室内办公环境、街景下)拍摄的证件(例如身份证，营业执照，驾驶证，行驶证)识别其中的文字。

背景技术

识别证件图像中的文字在许多场景下都十分普遍重要，如在金融场景下的远程开户、线上借贷、支付验证等场景下，我们需要识别用户身份证的姓名，地址，身份证号码等信息，以查验是否人证合一；工商部门执法，往往需要识别营业执照的企业名称、法人代表、统一社会信用代码，看企业的企业名称，法人代表，统一社会信用代码等重要信息是否与工商部门系统里数据库的记录一致。以确保该企业的合法性。在交通执法、车辆管理所等场景往往也需要识别驾驶证、行驶证中的证号、有效期、车辆代码等信息。

广州恒巨信息科技有限公司在其申请的专利文献“一种身份证识别方法”(专利申请号201610008974.3，公开号105701488A)中公开了一种基于图像处理的身份证识别方法。该方法包括以下步骤：(1)采集身份证图像，(2)将采集的身份证图像进行预处理，(3)对预处理后的图像进行定位分割，(4)对定位分割后的图像进行识别。该方法存在的不足之处是：由于该方法在将采集的身份证图像进行预处理和对预处理后的图像进行定位分割时需要用二值化算法将原图像变成二值化图像，然而二值化算法对图片质量、成像环境要求非常严格，对噪声十分敏感，证件图像背景又包含纹理，每次利用证件图像文字识别算法时必须先拍摄图片，再对拍摄图片进行预处理，若拍摄环境苛刻，则预处理效果较差，导致无法识别。

福州大学在其申请的专利文献“复杂场景下基于内特征和文本域布局的驾驶证检测识别方法”(专利申请号201810218038.4，公开号108427946A)中公开了一种基于内特征和文本域布局的驾驶证检测识别方法。该方法包括以下步骤，(1)用归一化和SSR增强等技术预处理图像,(2)用形态学操作和线段修补对证件中的车型框边框进行修补,通过轮廓检测与过滤得到车型框轮廓,(3)求拟合直线的交点得到车型框顶点,结合标准驾驶证布局得到驾驶证区域图像，(4)然后分析积分投影信息对车型文本区域位置进行精细定位,从它开始,每次找临近的未定位区域进行粗定位和精细定位得到文本区域图像,并在地址栏以上区域进行倾斜校正，(5)最后融合多种方法对文本区域二值化,用专训的文字识别引擎识别文字。该方法不足之处是：由于该方法先要用形态学操作和线段修补对证件中的车型框边框进行修补,通过轮廓检测与过滤得到车型框轮廓,然后求拟合直线的交点得到车型框顶点,根据标准驾驶证中的车型框轮廓区域占整张驾驶证的比例大小来确定驾驶证区域图像的位置，如此得到的驾驶证区域图像十分依赖驾驶证中的车型框轮廓区域的定位以及驾驶证整体布局必须十分标准，由于每个人拍摄出来的驾驶证图片是存在差异的，导致驾驶证中的车型框轮廓区域占整张驾驶证的比例大小是无法确定的，驾驶证区域图像的位置就无法准确定位，导致后面的文本区域无法精细定位，进而影响文本区域内的文字识别，使得该方法识别场景较为单一，在复杂场景下识别准确率较低。

发明内容

本发明的目的在于针对上述现有技术存在的不足，提出一种基于深度学习的自然场景证件图像文字识别方法，解决现有证件图像文字识别方法对拍摄环境要求苛刻，识别场景单一，在复杂场景中识别准确率低的问题。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于西安电子科技大学，未经西安电子科技大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201910630252.5/2.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G06 计算；推算；计数

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]基于深度学习的自然场景证件图像文字识别方法有效

专利文献下载