[发明专利]用于冠字号识别的字符污染去除方法有效
申请号: | 201510700369.8 | 申请日: | 2015-10-26 |
公开(公告)号: | CN105354566B | 公开(公告)日: | 2019-01-22 |
发明(设计)人: | 钟宬;潘惠彬;凌志峰;邹相;赵旦 | 申请(专利权)人: | 江苏国光信息产业股份有限公司 |
主分类号: | G06K9/20 | 分类号: | G06K9/20;G06K9/46;G07D7/206 |
代理公司: | 南京纵横知识产权代理有限公司 32224 | 代理人: | 董建林;许婉静 |
地址: | 213015 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 字号 识别 字符 污染 去除 方法 | ||
本发明公开了用于冠字号识别的字符污染去除方法,本发明主要包括确定10个字符分界线、初步确定相邻分界线之间的区域中单个冠字号图像的外接矩形框、单个字符高度异常处理、单个字符宽度异常处理等关键步骤。确定10个字符分界线使用模板匹配方法匹配出10个字符区域分界线情况和所处位置,其中包括模板制作方法和利用模板匹配的方法。初步确定相邻分界线之间的区域中单个冠字号图像的外接矩形框,其中对一般情况、粘连情况、字符断裂等情况进行了处理。对单个字符高度的异常处理,提供了两种方法来使字符高度合理。对单个字符宽度的异常处理,本发明去污染效果良好,提高了冠字号的识别率。
技术领域
本发明属于数字图像处理领域,尤其涉及一种用于冠字号识别的字符污染去除方法。
背景技术
纸币作为流通币,在人们的日常生活中起着举足轻重的作用。在流通过程中,可能会出现不同程度的污染,如纸币自身的红色油墨污染,铅笔的涂写,纸币使用时间久了开始破旧,纸币图像采集过程中光照不均以及无法避免的噪声等各种原因给冠字号识别带来一定的困难。
纸币冠字号识别要求识别结果准确,为了能有效地对纸币冠字号进行识别,在冠字号分割的过程中,需要利用计算机视觉技术和图像处理技术对污染的纸币冠字号区域进行处理,有效去除污染,得到可以识别的冠字号。
目前国内外纸币冠字号识别的方法很多,主要是针对七成新以上的纸币,没有对冠字号污染的纸币作处理的操作。有的对冠字号污染的纸币处理,但只通过二值操作以及中值滤波去噪等简单的方法,不能有效的去除污染。目前针对污染过的冠字号纸币还没有一种行之有效的方法,导致旧的污染纸币冠字号识别率不高,影响程序的可靠性。
发明内容
针对现有技术的不足,本发明提供一种用于冠字号识别的字符污染去除方法,能够有效的去除冠字号的污染,提高冠字号的识别率。
本发明解决其技术问题所采用的技术方案如下,用于冠字号识别的字符污染去除方法,包括以下步骤:
a)在冠字号所在区域的图像I上确定11条分界线,使得相邻的两条分界线间有且仅有单个冠字号的图像;
b)初步确定相邻分界线之间的区域中单个冠字号图像的外接矩形框;
c)对单个冠字号的高度和宽度分别进行异常处理,从而最终确定10个冠字号的外接矩形框。
进一步的,所述在冠字号所在区域的图像I上确定11条分界线,使得相邻的两条分界线间有且仅有单个冠字号的图像具体包括模板构建过程与实际计算过程,其中模板构建过程包括如下步骤:
a1)取一张纸币,使用自适应阈值方法,计算无污染图像I的二值图,其中白色为前景,黑色为背景;
a2)计算二值图的垂直投影,此垂直投影为一向量,记为pv=[p1,p2,…pW],其中W为图像I的宽度;
a3)人工判断图像I中第一个冠字号的最左端离图像左端的像素距离,记为s,另外,当图像的分辨率确定后,冠字号的总像素宽度是确定的,记为l,则抽取向量pv中第s个到第s+l-1个元素,记为pv'=[ps,ps+1,…ps+l-1];
a4)重复步骤a1)-a3),获得np个pv',并将np个pv'求平均,则获得一个模板m;a5)在9个间隔处将数值最低的位置进行标记,再加上头尾两处,一共可找到11条分界线,将其横坐标记为:b=[b0,b1,…b10],其中b0=0,b10=l;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江苏国光信息产业股份有限公司,未经江苏国光信息产业股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510700369.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:深井探测用电力通信智能电缆
- 下一篇:一种高张力漆包线