[发明专利]一种复杂场景下身份证图片信息识别系统在审
申请号: | 201810127310.8 | 申请日: | 2018-02-08 |
公开(公告)号: | CN108446699A | 公开(公告)日: | 2018-08-24 |
发明(设计)人: | 孔凡运;赵曙光;李顿伟 | 申请(专利权)人: | 东华大学 |
主分类号: | G06K9/34 | 分类号: | G06K9/34;G06K9/00 |
代理公司: | 上海泰能知识产权代理事务所 31233 | 代理人: | 宋缨;钱文斌 |
地址: | 201620 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 身份证图片 复杂场景 身份证号 人脸 图像上传模块 信息识别系统 提取模块 图像旋转 身份证 拍摄环境 位置提取 上传 图片 | ||
本发明涉及一种复杂场景下身份证图片信息识别系统,包括图像上传模块、图像旋转模块、身份证号识别模块和身份证人脸提取模块,所述图像上传模块用于身份证图片上传;所述图像旋转模块用于身份证图片文字旋转;所述身份证号识别模块用于复杂场景下身份证号位置提取、识别;所述身份证人脸提取模块用于从图片中提取人脸。本发明能够提高复杂拍摄环境下OCR识别率。
技术领域
本发明涉及身份证识别技术领域,特别是涉及一种复杂场景下身份证图片信息识别系统。
背景技术
OCR(Optical Character Recognition,光学字符识别)的概念早于1920年代便被提出,一直是模式识别领域中重要的研究方向。
近年来,随着移动设备的快速更新迭代,以及移动互联网的快速发展,使得OCR有更为广泛的应用场景,从以往的扫描文件的字符识别,到现在应用到自然场景中图片文字的识别,如识别身份证、银行卡、门牌、票据及各类网络图片中的文字。
OCR技术步骤如下:
首先文本定位,接着进行倾斜文本矫正,之后分割出单字后,并对单字识别,最后基于统计模型(如隐马尔科夫链,HMM)进行语义纠错。可按处理方式划分为三个阶段:预处理阶段、识别阶段和后处理阶段。其中关键在于预处理阶段,预处理阶段的质量直接决定了最终的识别效果,因此这里详细介绍下预处理阶段。
预处理阶段中包含了三步:
(1)定位图片中的文字区域,而文字检测主要基于连通域分析的方法,主要思想是利用文字颜色、亮度、边缘信息进行聚类的方式来快速分离文字区域与非文字区域,较为流行的两个算法分别是:最大极值稳定区域(MSER)算法及笔画宽度变换(SWT)算法,而在自然场景中因受到光照强度、图片拍摄质量和类文字背景的干扰,使得检测结果中包含非常多的非文字区域,而目前从候选区域区分出真正文字区域主要两种方法,用规则判断或轻量级的神经网络模型进行区分;
(2)文本区域图像矫正,主要基于旋转变换和仿射变换;
(3)行列分割提取出单字,这一步利用文字在行列间存在间隙的特征,通过二值化并在投影后找出行列分割点。
发明内容
本发明所要解决的技术问题是提供一种复杂场景下身份证图片信息识别系统,能够提高复杂拍摄环境下OCR识别率。
本发明解决其技术问题所采用的技术方案是:提供一种复杂场景下身份证图片信息识别系统,包括图像上传模块、图像旋转模块、身份证号识别模块和身份证人脸提取模块;所述图像上传模块用于身份证图片上传;所述图像旋转模块用于身份证图片文字旋转;所述身份证号识别模块用于复杂场景下身份证号位置提取和识别;所述身份证人脸提取模块用于从图片中提取人脸。
所述图像旋转模块通过Hough变换提取直线,从直线顶端像素点开始分别计算多个角度对应的原点到直线的距离;遍历整个图像的像素点上述步骤,找出重复最多的距离,得到该直线对应的直线方程,最终得出旋转角度。
所述身份证号识别模块首先通过自适应二值化将复杂场景图像转化为二值化图像,在通过均值滤波去除图像噪点,接着对图像进行腐蚀、膨胀将图像上不同的小区域结合起来;在通过opencv找到长条形轮廓,即为身份证号位置,在通过tesseract开源ocr软件识别出对应的身份证号,最终对识别出的数字字母进行文本矫正,输出结果。
所述通过自适应二值化将复杂场景图像转化为二值化图像时在像素(x,y)点周边选取一个b×b的区域,计算此b×b区域的加权平均值W(x,y),将加权均值W(x,y)与一固定参数相减得到阈值T(x,y)。
所述均值滤波去除图像噪点具体为:对待处理的当前像素选择一个模板,该模板为其邻近的若干个像素组成,用模板的均值来替代原像素的值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东华大学,未经东华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810127310.8/2.html,转载请声明来源钻瓜专利网。