[发明专利]一种文本图像二值化的优化方法有效
申请号: | 201510257271.X | 申请日: | 2015-05-13 |
公开(公告)号: | CN104866850B | 公开(公告)日: | 2018-11-02 |
发明(设计)人: | 高协平;张胜龙;胡凯 | 申请(专利权)人: | 湘潭大学 |
主分类号: | G06K9/38 | 分类号: | G06K9/38 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 411105 湖*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种文本图像二值化的优化方法,本发明具有如下的技术效果,(1)本发明提出了一种优化二值化的方法。现有的二值化算法,对于不同退化类型的文本图像,都有着自己不同的特点和准确度,而本发明能够很好的在现有二值图的基础上进行二次优化,保留二值化算法自身的优点,进一步提升二值化方法的准确度。(2)本发明提出了一种以每个区域中、每一行或者每一列像素中某一类作为特征的像素所占的百分比作为判断其中所有像素分类的方法,不仅仅可以用到该发明中,对于很多其它需要细致分类的情况,在已经初步得到分类信息的情况下,都能够很好的借鉴此方法进行二次分类。 | ||
搜索关键词: | 一种 文本 图像 二值化 优化 方法 | ||
【主权项】:
1.一种文本图像二值化的优化方法,其特征在于包括以下步骤:步骤1:用二值化算法对原始文本图像进行二值化后得到的二值图,作为初始二值图;对原始文本图像运用k‑means算法,以图像的所有像素点的像素值为对象进行分类,分类的数目设为k,分类以后就能得到一幅被标记为{I1,I2,I3...Ii}k类像素集合的图像,每个像素被标记为1~k中的一类,计算每个Ii集合中所有像素值的平均值Ai,记
Imin即为像素值均值最小的一类像素集合;步骤2:采用R.M.haralick连通区域检测算法在初始二值图中标记出每一个独立封闭的连通区域,连通区域是指图像中的一个最大连通子集,在一个最大连通子集中任意两个像素点P1(x1,y1),P1(x2,y2)满足:1≤(x1‑x2)2+(y1‑y2)2≤2 (1)得到一幅大小与初始二值图相同且被标记为1~m个连通区域的图像;步骤3:首先,对于步骤2中被标记的1~m个连通区域,任取标记为j(1≤j≤m)的连通区域,j连通区域中像素总个数为Sj,计算其中包含的Imin类像素的总数,记为mj,T1为一个设定的阈值,j连通区域中的像素通过以下规则重新分类,Qj(x)代表j连通区域中所有的像素:
将标记为1~m的每个连通区域中的像素通过上式划分后,即可去掉一部分错误划分为前景像素的区域,得到了二值图B2;然后,对二值图B2重新检测连通区域,得到标记为1~n的连通区域图,任取标记为j(1≤j≤n)的连通区域,每幅图像都是一个2维像素矩阵,矩阵中的每个像素都有自己的行、列下标,假设j连通区域中的像素的行下标为p~q,统计j区域中第f(p≤f≤q)行的Tmin类像素个数mjf和像素的总个数Sjf,T2为一个设定的阈值,对第f行像素按下式重新分类,Qjf(x)代表连通区域中f行的所有像素:
将标记为j连通区域用上式对连通区域中的每一行像素进行判断的同时记录该行像素划分的类别并将其记录在数组ajf,如果该行分类为背景像素,则该行的分类结果记为0存入数组中,反之则分类结果记为1,用公式表示如下:
ajf中的每一个数对应p~q中的一行像素,由此,当一个连通区域中的像素被逐行使用上式分类完成后,能够生成一个标记数组ajf作为附加条件; 只需把数组ajf所有元素中1与1中间的所有0代表的那行像素重新标记为前景像素即可,用上述方法将标记为1~n的连通区域中的行像素全部划分完; 最后,重新检测连通区域,对得到的每个连通区域中每列像素用上述相同方法进行分类,得到中期二值图;步骤4:使用Su提出的一个融合规则,即对初始二值图和中期二值图,同时被分类为前景或者背景的像素认为分类正确,其它不相同的字符像素分类为待定像素; 如下公式所示:
K(x)代表原始图像中的一个像素,Bi(x)代表初始二值图和中期二值图中K(x)位置像素的值,对于待定的像素,通过下式进行分类:![]()
式(6)中J(x)代表待定的像素,Con(x),I(x)代表像素J(x)的对比度值和像素值; ConF,IF代表了以J(x)为中心的局部窗口内前景像素的平均对比度值和平均灰度值,ConB和IB代表了局部窗口中的背景像素的平均对比度值和平均灰度值;式(7)中,(x,y)表示原始图像中像素的行列坐标,Con(x,y)表示每个像素的对比度值,灰度值I(x,y)表示原始图像中像素(x,y)处的像素值,以(x,y)为中心点取一个10×10的像素窗口,fmax(x,y)表示窗口中的最大像素值; ε为正的极小化因子,为了防止分母为零;记中期二值图为B3,初始二值图为B1,选择B1作为初始的迭代图像,将其与中期二值图B3结合运用公式(5)分类后,对于分类得到的所有待定像素,以每一个待定像素为中心取3×3的窗口,当窗口内有一个或1个以上的前景或者背景像素后,按照公式(6)中J(x)的判定条件对这个待定像素进行分类,分类完毕后换下一个待定像素继续分类,将所有待定像素分类完毕后得到的图像与第一次迭代图像B1做对比,不相同则将其作为第二次迭代的初始图像,继续与中期二值图B3相结合分类,重复之前步骤,一直迭代到相同,得到了最终优化后的二值图。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湘潭大学,未经湘潭大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510257271.X/,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序