[发明专利]一种基于多阈值融合的复杂背景文本图像提取方法及系统有效
申请号: | 201910250571.3 | 申请日: | 2019-03-29 |
公开(公告)号: | CN110008954B | 公开(公告)日: | 2021-03-19 |
发明(设计)人: | 王翊;辛沐霖;文静 | 申请(专利权)人: | 重庆大学 |
主分类号: | G06K9/32 | 分类号: | G06K9/32;G06K9/34;G06K9/46;G06K9/62 |
代理公司: | 重庆双马智翔专利代理事务所(普通合伙) 50241 | 代理人: | 顾晓玲 |
地址: | 400030 *** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 阈值 融合 复杂 背景 文本 图像 提取 方法 系统 | ||
1.一种基于多阈值融合的复杂背景文本图像提取方法,其特征在于,包括:
步骤S1,获取原始图像,得到图像类别信息,依据图像类别信息获取局部二值化参数;
步骤S2,将原始图像转换为灰度图像;
步骤S3,利用第一处理算法获取灰度图像基于边缘的第一二值图;利用第二处理算法基于局部二值化参数对灰度图像进行局部二值化处理得到第二二值图;
步骤S4,将第一二值图和第二二值图进行逻辑“或”操作后输出,即为提取出的文本图像;在所述步骤S1中图像类别信息包括背景颜色类别、亮度大小类别和清晰度高低类别;
在所述步骤S1中,依据图像类别信息获取局部二值化参数的步骤包括:
所述局部二值化参数包括局部二值化的切割阈值Ts,获取局部二值化的切割阈值Ts的公式为:
Ts=threshold1*xs1+xs2*deviation;
其中,threshold1为第二处理算法的初始分割阈值;deviation为偏差值;xs1和xs2分别为线性调整的系数值,均根据图像类别信息取值;
所述deviation的计算公式为:
deviation=(meanSquare-mean2)0.5,其中,meanSquare为原始图像平方操作后的二维均值滤波值,mean为原始图像的二维均值滤波值;
所述threshold1的计算公式为:
其中,R为deviation矩阵中的最大值;k为修正系数,0<k<1;
所述xs1和xs2的取值公式为:
2.如权利要求1所述的基于多阈值融合的复杂背景文本图像提取方法,其特征在于,判断所述背景颜色类别的过程包括:
将原始图像转换为YCbCr色彩空间图像,提取YCbCr色彩空间图像的Cb通道图像矩阵;
判断不等式mean(CbA)0.9是否为真,若为真,认为原始图像的背景为非白色,若不为真,认为原始图像的背景为白色;
其中,mean()表示计算括号内矩阵的平均值,Cb表示图像的Cb通道图像矩阵,CbA得到的是一个只有0和1的布尔型矩阵,mean(CbA)0.9表示Cb通道图像矩阵中像素值大于A的像素点个数占Cb通道图像矩阵像素点总数的比例小于90%,A为背景像素判定阈值,为正整数;
判断所述亮度大小类别的过程为:
计算原始图像的平均像素值;
当原始图像的背景为白色时,若平均像素值大于B,则认为原始图像的亮度为高亮度,否则为低亮度;当原始图像的背景为非白色时,若平均像素值大于C,则认为原始图像的亮度为高亮度,否则为低亮度;0<C<B,其中,B、C均为平均像素判定阈值。
3.如权利要求1所述的基于多阈值融合的复杂背景文本图像提取方法,其特征在于,判断原始图像的清晰度高低类别的过程包括为:
步骤S10,构建并利用n*n高斯高斯滤波器对原始图像进行滤波得到滤波图像;所述n为正整数;
步骤S11,利用Sobel算子获得原始图像的第一梯度图像,利用Sobel算子获得滤波图像的第二梯度图像;
步骤S12,计算原始图像与第一梯度图像的结构相似性指数,计算滤波图像与第二梯度图像的结构相似性指数,求取两个结构相似性指数的平均值作为平均结构相似性指数mSSIM,计算梯度结构相似度NRSS,计算公式为:
NRSS=1-mSSIM;
若NRSS<D,认为原始图像清晰度高,否则认为原始图像清晰度低,其中,D为清晰度判定阈值,0.0001<D<0.002。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆大学,未经重庆大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910250571.3/1.html,转载请声明来源钻瓜专利网。