[发明专利]用于冠字号识别的字符污染去除方法有效
申请号: | 201510700369.8 | 申请日: | 2015-10-26 |
公开(公告)号: | CN105354566B | 公开(公告)日: | 2019-01-22 |
发明(设计)人: | 钟宬;潘惠彬;凌志峰;邹相;赵旦 | 申请(专利权)人: | 江苏国光信息产业股份有限公司 |
主分类号: | G06K9/20 | 分类号: | G06K9/20;G06K9/46;G07D7/206 |
代理公司: | 南京纵横知识产权代理有限公司 32224 | 代理人: | 董建林;许婉静 |
地址: | 213015 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 字号 识别 字符 污染 去除 方法 | ||
1.用于冠字号识别的字符污染去除方法,其特征在于,包括以下步骤:
a)在冠字号所在区域的图像I上确定11条分界线,使得相邻的两条分界线间有且仅有单个冠字号的图像;
b)初步确定相邻分界线之间的区域中单个冠字号图像的外接矩形框,具体为:具体包括:
b1)将11条分界线所隔的10个区域编号为每个区域中都有且仅有一个冠字号图像的外接矩形框,设之为对于任意都有四个表征其在图像中位置的属性,即(l,r,u,b),分别表示该矩形的左、右、上、下边到图像I左、右、上、下端的距离,初始时将其设为-1;
b2)对于任意Ri,将其左边所在的区域记为其右边所在的区域记为若则跳转至b4),否则跳转至b3);
b3)将Ri在分界线bl,…,br-1处分裂,分裂为r-l+1个区域对于分裂而成的任意矩形框,分别执行步骤b4)的操作;
b4)若对应的的(l,r,u,b)都为-1,则将的(l,r,u,b)设为Ri的(l,r,u,b),若的(l,r,u,b)不为-1,则新的的(l,r,u,b)值被分别设为原来的和Ri中的(l,r,u,b)的较小值;
b5)最后,查看中的每一个外接矩形的四个属性,看其是否都非-1,若都非-1,则10个冠字号的外界矩形框成功建立,否则说明图像I并非冠字号图像,不予处理;
c)对单个冠字号的高度和宽度分别进行异常处理,从而最终确定10个冠字号的外接矩形框。
2.根据权利要求1所述的用于冠字号识别的字符污染去除方法,其特征在于:所述在冠字号所在区域的图像I上确定11条分界线,使得相邻的两条分界线间有且仅有单个冠字号的图像具体包括模板构建过程与实际计算过程,其中模板构建过程包括如下步骤:
a1)取一张纸币,使用自适应阈值方法,计算无污染图像I的二值图,其中白色为前景,黑色为背景;
a2)计算二值图的垂直投影,此垂直投影为一向量,记为pv=[p1,p2,…pW],其中W为图像I的宽度;
a3)人工判断图像I中第一个冠字号的最左端离图像左端的像素距离,记为s,另外,当图像的分辨率确定后,冠字号的总像素宽度是确定的,记为l,则抽取向量pv中第s个到第s+l-1个元素,记为pv'=[ps,ps+1,…ps+l-1];
a4)重复步骤a1)-a3),获得np个pv',并将np个pv'求平均,则获得一个模板m;
a5)在9个间隔处将数值最低的位置进行标记,再加上头尾两处,一共可找到11条分界线,将其横坐标记为:b=[b0,b1,…b10],其中b0=0,b10=l;
a6)每次取不同的纸币,重复步骤a1)-a5)nm次,获得nm个不同的模板,记作和与之对应的不同的分界线,记作
实际计算过程包括如下步骤:
a7)取一张纸币,使用自适应阈值方法,计算无污染图像I的二值图,其中白色为前景,黑色为背景;
a8)计算二值图的垂直投影,此垂直投影为一向量,记为pv=[p1,p2,…pW],其中W为图像I的宽度;
a9)分别计算pv与模板的相关系数,并记录其结果为其中,ci,i=1,…,nm为一个长度为W-l+1的向量;
a10)分别寻找中的最大值,记为并找到这些最大值中的最大值,记其对应的下标号为i,则应选取的模板为mi,分界线为bi;
a11)查找在ci中的位置,并将其位置记为j,则可知第一条分界线离图像左端的距离为j,因此,图像中真正的分界线为bi+j,从而确定了这11条分界线的位置。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江苏国光信息产业股份有限公司,未经江苏国光信息产业股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510700369.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:深井探测用电力通信智能电缆
- 下一篇:一种高张力漆包线