[发明专利]一种文本图像二值化的优化方法有效

申请号：	201510257271.X	申请日：	2015-05-13
公开（公告）号：	CN104866850B	公开（公告）日：	2018-11-02
发明（设计）人：	高协平;张胜龙;胡凯	申请（专利权）人：	湘潭大学
主分类号：	G06K9/38	分类号：	G06K9/38
代理公司：	暂无信息	代理人：	暂无信息
地址：	411105 湖***	国省代码：	湖南;43
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明公开了一种文本图像二值化的优化方法，本发明具有如下的技术效果，(1)本发明提出了一种优化二值化的方法。现有的二值化算法，对于不同退化类型的文本图像，都有着自己不同的特点和准确度，而本发明能够很好的在现有二值图的基础上进行二次优化，保留二值化算法自身的优点，进一步提升二值化方法的准确度。(2)本发明提出了一种以每个区域中、每一行或者每一列像素中某一类作为特征的像素所占的百分比作为判断其中所有像素分类的方法，不仅仅可以用到该发明中，对于很多其它需要细致分类的情况，在已经初步得到分类信息的情况下，都能够很好的借鉴此方法进行二次分类。
搜索关键词：	一种文本图像二值化优化方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种文本图像二值化的优化方法，其特征在于包括以下步骤：步骤1：用二值化算法对原始文本图像进行二值化后得到的二值图，作为初始二值图；对原始文本图像运用k‑means算法，以图像的所有像素点的像素值为对象进行分类，分类的数目设为k，分类以后就能得到一幅被标记为{I₁，I₂，I₃...I_i}k类像素集合的图像，每个像素被标记为1～k中的一类，计算每个I_i集合中所有像素值的平均值A_i，记I_min即为像素值均值最小的一类像素集合；步骤2：采用R.M.haralick连通区域检测算法在初始二值图中标记出每一个独立封闭的连通区域，连通区域是指图像中的一个最大连通子集，在一个最大连通子集中任意两个像素点P1(x1，y1)，P1(x2，y2)满足：1≤(x1‑x2)2+(y1‑y2)2≤2 (1)得到一幅大小与初始二值图相同且被标记为1～m个连通区域的图像；步骤3：首先，对于步骤2中被标记的1～m个连通区域，任取标记为j(1≤j≤m)的连通区域，j连通区域中像素总个数为Sj，计算其中包含的Imin类像素的总数，记为mj，T1为一个设定的阈值，j连通区域中的像素通过以下规则重新分类，Qj(x)代表j连通区域中所有的像素：将标记为1～m的每个连通区域中的像素通过上式划分后，即可去掉一部分错误划分为前景像素的区域，得到了二值图B2；然后，对二值图B2重新检测连通区域，得到标记为1～n的连通区域图，任取标记为j(1≤j≤n)的连通区域，每幅图像都是一个2维像素矩阵，矩阵中的每个像素都有自己的行、列下标，假设j连通区域中的像素的行下标为p～q，统计j区域中第f(p≤f≤q)行的Tmin类像素个数mjf和像素的总个数Sjf，T2为一个设定的阈值，对第f行像素按下式重新分类，Qjf(x)代表连通区域中f行的所有像素：将标记为j连通区域用上式对连通区域中的每一行像素进行判断的同时记录该行像素划分的类别并将其记录在数组ajf，如果该行分类为背景像素，则该行的分类结果记为0存入数组中，反之则分类结果记为1，用公式表示如下：ajf中的每一个数对应p～q中的一行像素，由此，当一个连通区域中的像素被逐行使用上式分类完成后，能够生成一个标记数组ajf作为附加条件；只需把数组ajf所有元素中1与1中间的所有0代表的那行像素重新标记为前景像素即可，用上述方法将标记为1～n的连通区域中的行像素全部划分完；最后，重新检测连通区域，对得到的每个连通区域中每列像素用上述相同方法进行分类，得到中期二值图；步骤4：使用Su提出的一个融合规则，即对初始二值图和中期二值图，同时被分类为前景或者背景的像素认为分类正确，其它不相同的字符像素分类为待定像素；如下公式所示：K(x)代表原始图像中的一个像素，Bi(x)代表初始二值图和中期二值图中K(x)位置像素的值，对于待定的像素，通过下式进行分类：式(6)中J(x)代表待定的像素，Con(x)，I(x)代表像素J(x)的对比度值和像素值； ConF，IF代表了以J(x)为中心的局部窗口内前景像素的平均对比度值和平均灰度值，ConB和IB代表了局部窗口中的背景像素的平均对比度值和平均灰度值；式(7)中，(x，y)表示原始图像中像素的行列坐标，Con(x，y)表示每个像素的对比度值，灰度值I(x，y)表示原始图像中像素(x，y)处的像素值，以(x，y)为中心点取一个10×10的像素窗口，fmax(x，y)表示窗口中的最大像素值； ε为正的极小化因子，为了防止分母为零；记中期二值图为B3，初始二值图为B1，选择B1作为初始的迭代图像，将其与中期二值图B3结合运用公式(5)分类后，对于分类得到的所有待定像素，以每一个待定像素为中心取3×3的窗口，当窗口内有一个或1个以上的前景或者背景像素后，按照公式(6)中J(x)的判定条件对这个待定像素进行分类，分类完毕后换下一个待定像素继续分类，将所有待定像素分类完毕后得到的图像与第一次迭代图像B1做对比，不相同则将其作为第二次迭代的初始图像，继续与中期二值图B3相结合分类，重复之前步骤，一直迭代到相同，得到了最终优化后的二值图。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于湘潭大学，未经湘潭大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201510257271.X/，转载请声明来源钻瓜专利网。

上一篇：一种用于立体图像质量客观评价的极端学习机
下一篇：一种基于KNN和像素比梯度特征的静态手语识别方法

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种文本图像二值化的优化方法有效

专利文献下载