[发明专利]一种二维字符图形验证码复杂背景噪音干扰去除方法有效
申请号: | 201510712542.6 | 申请日: | 2015-10-28 |
公开(公告)号: | CN105404885B | 公开(公告)日: | 2019-03-22 |
发明(设计)人: | 李蓉 | 申请(专利权)人: | 北京工业大学 |
主分类号: | G06K9/34 | 分类号: | G06K9/34;G06K9/44 |
代理公司: | 北京思海天达知识产权代理有限公司 11203 | 代理人: | 沈波 |
地址: | 100124 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种二维字符图形验证码复杂背景噪音干扰去除方法,本方法在读入一张验证码图片后,对其实施背景颜色的量化操作,通过减少背景颜色,达到消除杂乱背景,突出字符的目的。在第一步平滑步骤中,设计了一个EPSF算法,目的是在平滑的同时保持边缘不被模糊;本算法用一个高斯核双边滤波器来代替EPSF算法,同原来的EPSF算法相比,高斯核双边滤波器在平滑图像的同时,保持边缘不被模糊的效果上要优于EPSF算法,这样就能确保字符的结构不被破坏,为后续字符识别奠定基础。在颜色类归并时,本算法采用层次聚类算法,对颜色进行自适应的合并。实践表明,本算法能对一些在复杂背景下的验证码的背景噪音进行有效去除。 | ||
搜索关键词: | 一种 二维 字符 图形 验证 复杂 背景 噪音 干扰 去除 方法 | ||
【主权项】:
1.一种二维字符图形验证码复杂背景噪音干扰去除方法,其特征在于:本方法实施的过程如下,S1预处理S1.1读入验证码图片,用双边滤波器对其进行滤波;双边滤波器的基本思想是同时考虑定义域即像素空间邻域和值域即像素亮度空间邻域的差异;输出像素的值依赖于邻域像素值的加权和,其公式如下:
其中,g(i,j)表示输出图像第i行第j列的像素亮度值;f(k,l)表示输入图像第k行第l列的像素亮度值,它是第i行第j列像素的邻域像素,即k,=i‑m,l=j‑n,其中m,n的取值为‑1,0,1;分子项为第i行第j列像素的八邻域像素的加权和,权值为w(i,j,k,l);分母是规范化项,确保权值的和为1;权值系数w(i,j,k,l)由定义域核和值域核的乘积决定;定义域核和值域核均为高斯函数,如下:定义域核:
值域核:
权值为:
S1.2实施通道分割,将滤波后的图分解为R、G、B三个通道图像S2颜色减少S2.1子采样S2.1.1对R、G、B三通道的每个通道,分别采用x向Sobel和y向Sobel边缘检测算子进行x向、y向的边缘检测,分别获得x向的边图和y向的边图;x向和y向的Sobel算子模板分别如下:
这样总共能获得六个边图,分别记为:Grx,Gry,Ggx,Ggy,Gbx,Gby它们分别是红色通道x向梯度图Grx,红色通道y向梯度图Gry,绿色通道x向梯度图Ggx,绿色通道y向梯度图Ggy,蓝色通道x向梯度图Gbx,蓝色通道y向梯度图Gby;S2.1.2为R、G、B三个通道图中的每个象素i,用如下公式分别计算该象素在三个通道中的梯度值:![]()
![]()
其中,Gixr为红色通道中第i个像素的x向梯度值,Giyr为红色通道中第I个像素的y向梯度值;Gixg为绿色通道中第i个像素的x向梯度值,Giyg为绿色通道中第i个像素的y向梯度值;Gixb为蓝色通道中第i个像素的x向梯度值,Giyb为蓝色通道中第i个像素的y向梯度值;S2.1.3对每个象素i,选择三个通道的梯度值中最大值作为该象素最终的梯度值:Gi=max(Gri,Ggi,Gbi)处理完之后得到一个梯度图像G,G中每个象素i的值即为Gi;S2.1.4在获得的梯度图像G中,选择满足如下条件的局部极小值点作为子采样点:若该点的梯度值,均小于等于其八个邻域的梯度值,则选择该点作为采样点;由于边上的象素点的梯度均较大,这样采样的点不包括边缘象素点,均为物体内部的点;这些点代表了当前图片上的颜色,本方法的目标是将一些相近的颜色进行合并,即实施颜色减少;S2.2初始颜色聚类S2.2.1根据所获得的采样点集合,统计出这些采样点的三维颜色直方图,记为P(r,g,b),该直方图的每一个条目bin,记录颜色为(r,g,b)的采样点数目;S2.2.2标记所有的初始采样点均为未处理S2.2.3随机从初始采样点集合中取一个标记为未处理的点Si,进行如下操作:以该像素点Si的颜色值(ri,gi,bi)为中心,定义一个边长为2h的立方体,作为该颜色的一个邻域,该立方体的六个面定义如下:ri‑h,ri+h,gi‑h,gi+h,bi‑h,bi+hS2.2.4从颜色包含在该立方体内的所有像素计算出像素颜色的平均值Smi(rmi,gmi,bmi),标记所有颜色在该立方体内的像素为已处理;S2.2.5重复步骤c,直到所有的像素点均被处理经过这样的处理后,可以得到一系列的均值像素点的集合Smi,该均值像素点集的数量k小于初始的颜色数量,并且k的数量和颜色立方体的边长2h有关,h越大,k越小;然而k与实际需要划分的颜色类的数目相比还要更大,以下利用mean‑shift算法进一步实施颜色减少S2.3基于Mean‑Shift的颜色减少S2.3.1从S2.2中所获得的均值像素点集中任取一个未处理的均值像素颜色值(rmi,gmi,bmi),标记该点为已处理;S2.3.2以该点为中心计算该像素颜色值的h邻域立方体内的颜色均值(rni,gni,bni),计算新的均值(rni,gni,bni)和原值的曼哈顿距离:d=|rni‑rmi|+|gni‑gmi|+|bni‑bmi|S2.3.3若距离d小于预定义阈值(此处定义为3),标记当前邻域中的所有颜色为已处理,并存储均值像素颜色,转到步骤a;否则,以新计算的像素点颜色值(rni,gni,bni)为中心,重复步骤b;经过上述步骤,获得颜色集合Smf,该颜色集合中的颜色数目要少于S2.2结束后的颜色数;S2.4基于层次凝聚聚类算法进行最终的颜色类合并S2.4.1设颜色集合Smf中的颜色数目为N,计算该集合中任意两种颜色的Chebyshev距离,并构造一个上三角距离矩阵D如下:
其中dij表示集合Smf中任意两种颜色i和j的Chebyshev距离;S2.4.2创建一个同样大小的上三角标记矩阵L,初始值均为0
S2.4.3设定初始label=1,按照如下算法更新标记矩阵L中的值:
S2.4.4经过上述处理,颜色相近,即距离值dij小于阈值的颜色值点被设定为相同的标记,即被归为同一类。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510712542.6/,转载请声明来源钻瓜专利网。
- 上一篇:具有装饰用外覆膜的塑质薄壳件及其制法
- 下一篇:工字轮专用吊具