[发明专利]基于模板匹配的印刷体数字识别方法有效

专利信息
申请号: 201410624087.X 申请日: 2014-11-08
公开(公告)号: CN104463195B 公开(公告)日: 2018-08-07
发明(设计)人: 宫义山;王鹏 申请(专利权)人: 沈阳工业大学
主分类号: G06K9/62 分类号: G06K9/62;G06K9/34;G06K9/40
代理公司: 沈阳智龙专利事务所(普通合伙) 21115 代理人: 宋铁军;周智博
地址: 110870 辽宁省沈*** 国省代码: 辽宁;21
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明提供一种基于模板匹配的印刷体数字识别方法,该方法包括待识别图像输入部分、模板匹配识别部分、识别结果输出部分,其很好的挺高了印刷体数字识别的识别率和系统的抗干扰性。通过对模板匹配方法的研究和实现,为数字识别提供了新的解决途径和思路,非常有使用价值和改进的价值。
搜索关键词: 基于 模板 匹配 印刷体 数字 识别 方法
【主权项】:
1.一种基于模板匹配的印刷体数字识别方法,其特征在于:该方法包括待识别图像输入部分、模板匹配识别部分、识别结果输出部分,具体步骤如下:待识别图像输入部分,包括以下步骤:步骤1、通过外部设备照相机采集待识别数字的图像,本步骤中相机像素必须达到300万像素以上,使采集的图像达到最低识别要求,将采集好的图像输入系统;步骤2、将输入的待识别图像进行前期预处理,首先将图像通过中值滤波法去除噪声,其次将彩色图像进行灰度化处理,再次对灰度化的图像进行二值化处理,然后对二值化的图像进行噪声粘连区域修复再采用自适应阈值分割对数字图像分割,最后将分割好的数字图像归一化处理,将处理好的图像输入模板匹配识别部分;模板匹配识别部分,该部分的识别基于模板匹配的印刷体数字识别方法,包括以下步骤:步骤1、将与待识别字体相同的标准数字模板图像导入程序数据库中,模板图像为白色背景,黑色数字,故数字区像素值为0,背景区像素值为1;步骤2、将待识别图像输入部分生成的二值化图像与模板图像对应像素位叠加,其中待识别的二值化图像为黑色背景,白色数字,数字区像素值为1,背景区像素值为0;步骤3、对叠加后的图像中各像素点的像素值进行统计,分析统计出的数据,并识别出待识别的印刷体数字;识别结果输出部分,将识别结果通过计算机显示器显示出来或通过打印机输出结果,或者根据该系统应用的领域将该领域数据融入系统中,得出该数字所关联的全部相关信息;具体方法如下:(一)图像预处理过程:(1)图像采集:数字图像通过联机的摄像设备采集,或通过已经保存的图像进行识别,如果采集的图像是利用相机拍摄的发票电子照片,印刷体数字识别的形态稳定且结构简单,所以识别过程所需要的信息量相对其他识别较少,利用相机拍摄取得的数字图像已经能够取得满足识别的要求;(2)图像去噪处理:中值滤波器用像素的相邻区域的像素的灰度中值代替该像素的灰度值,是最常见的统计滤波器,自适应中值滤波器则能够对比较大的概率的噪声进行处理,还能够在平滑非冲激噪声的同时保存细节,该步骤中采用3*3模板的自适应中值滤波器;(3)图像灰度化:相机采集的图片为24位真彩图,需要转化为灰度图,用g标示灰度化后的灰度值,R,G,B表示真彩图中的红、绿、蓝分量,g=0.299R+0.587G+0.114B;(4)图像二值化:字符图像二值化是将256色的灰度图转化为只有黑白两色的二值图,该步骤中,由于转化后的图像目标为白色,背景为黑色,所以要在图像二值化之前对图像进行反运算,图像二值化是数字识别系统中非常重要的一步,其效果的好坏直接影响到数字的边缘分布,好的二值化算法能够有效区分前景和背景,得到真实的字符边缘,也就能够得到准确的数字特征;(5)图像分割预处理:针对图像中连通面积低于阈值的,判定为噪声粘连区域,最后,对噪声粘连区域进行反色处理,从而消除分割过程中的噪声粘连区域和去噪环节无法去除的杂点,从而进行正常的数字分割;(6)图像分割:利用投影法将数字水平分开后,就成功地找到了每个数字的左右边界;然后对切分好的每位数字再进行水平投影:即计算每位数字的每一行中属于数码的像素数目,这样能够找出每个数字的高度值;(7)图像归一化:数字大小归一化是指对不同大小的数字作几何变换,使之成为同一大小尺寸;数字大小归一化要求保持数字的拓扑结构不能改变,最大限度地降低数字的失真,以便提高识别准确率;令f(x,y)为原图像,g(x′,y′)为归一化后的图像,归一化后的图像与原图像的坐标之间的映射关系为:x=ηx′y=εy′其中:η=width/width′ε=height/height′width,width′分别表示原图像和归一化后图像的宽度,同时,height和height′分别表示原图像和归一化后图像的高度;归一化后(x′,y′)点的灰度值为:g(x′,y′)=f(x,y)输出点会被映射到原图像的浮点数的位置,这就需要使用插值算法来计算该点的像素值;插值算法为双线性插值法;双线性插值中,设原图像点(x,y)周围四个像素点分别为(i,j),(i,j+1),(i+1,j),(i+1,j+1),双线性插值通过以下公式来计算:u=(1‑λ)f(i,j)+λf(i,j+1)v=(1‑λ)f(i+1,j)+λf(i+1,j+1)g(x′,y′)=(1‑μ)u+μv其中λ=|x‑i|,μ=|y‑j|;(二)、模板匹配部分:(1)将与待识别字体相同的模板图像导入程序数据库中,本方法对发票编号进行识别所以先将发票编号字体的数字模板导入数据库中;(2)将待识别的图像与模板库中图像进行像素点叠加;(3)匹配结果统计首先由于图像经过二值化处理之后,图像变成了一个只有0,1组成的二维矩阵,待识别数字经二值化之后也成为一个二维矩阵,将图像分为数字区和背景区,待识别数字的数字区是由1组成的,背景区是由0组成的;而模板正是相反,其数字区是由0组成的,背景区是由1组成的;经过待识别数字与模板进行加法运算,生成一个由0,1,2组成的二维矩阵;理论上如果两个图像完全匹配,值为1的位与对应0的位相加则必定生成一个只有1组成的二维矩阵;但如果不匹配则会出现0和2这两种结果;所以只需统计匹配之后图像中像素值为0和2所占整体图像的比例便能识别出结果;(三)、匹配结果输出模块:将识别结果通过计算机显示器显示出来或通过打印机输出结果或根据该系统应用的领域将该领域数据融入系统中,得出该数字的全部相关信息。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于沈阳工业大学,未经沈阳工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201410624087.X/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top