[发明专利]基于自适应多阈值的字符识别预处理二值化方法有效
申请号: | 201811242923.2 | 申请日: | 2018-10-24 |
公开(公告)号: | CN109543686B | 公开(公告)日: | 2023-04-25 |
发明(设计)人: | 朱德利;杨雨浓;杨德刚;万辉 | 申请(专利权)人: | 重庆师范大学 |
主分类号: | G06V30/162 | 分类号: | G06V30/162;G06V30/148 |
代理公司: | 北京海虹嘉诚知识产权代理有限公司 11129 | 代理人: | 吕小琴 |
地址: | 401331 重*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 自适应 阈值 字符 识别 预处理 二值化 方法 | ||
本发明提供的一种基于自适应多阈值的字符识别预处理二值化方法,包括步骤:S1:获得原始图像中每个像素点的二值化标准阈值;S2:对原始图像进行优化,得到优化后的图像;S3:获取优化后图像的积分图数表;S4:计算原始图像的各像素点的二值化标准阈值;S5:获得原始图像中每个像素点的松弛因子ξ;S6:求每个像素点的二值化标准阈值与松弛因子的乘积,得到每个像素点的二值化松弛阈值;S7:运用二值化松弛阈值原始图像进行二值化处理;本发明解决移动终端字符识别应用中光照不均匀,环境不可控导致的识别效果不佳的问题,减小了计算松弛因子的时间开销,提高了对需进行字符识别的图像的二值化预处理的效率和精度。
技术领域
本发明涉及字符识别领域,具体涉及一种基于自适应多阈值的字符识别预处理二值化方法。
背景技术
随着移动互联网在社会生活各个层面的快速推进,对移动终端应用能快速而又准确的进行字符识别的需求越来越多。二值化是字符识别前不可或缺的预处理过程。二值化的效果直接决定了字符的分割、特征提取和模式识别的准确性。然而移动终端应用环境具有较大的不确定性,在移动环境下获取图像时通常不可避免的会受到灯光、人影或其他不同物体的阴影的影响。在这样的环境影响下,采集到的图像和与实际图像相比会有较大的差异。亮度不可控对待识别的图像二值化效果有较大的副作用,从而直接影响了字符识别的准确度。
二值化是以一定的规则将灰度图像分成背景和前景两个部分。由于在字符识别应用中的重要性,二值化方法得到了国内外学者的广泛研究,产生了许多方法。常用的方法有全局阈值法和局部阈值法。其中全局阈值法是整个图像只有一个阈值,包括直方图双峰法、最大类间方差法、最小误差阈值法等;局部阈值方法允许一张图像有多个阈值,包括阈值差值法、水线阈值法、基于小波的多阈值方法等。为解决相关应用问题,近年来在该领域产生了一些新的方法。段锁林等人提出了一种多窗口图像二值化算法,采用多窗口模板分别对图像进行简单二值化处理,对不同窗口处理下获得的二值图进行综合判断,最终确定每个像素点的值。从飞等人提出利用数学形态学理论,采用改进的Sauvola算法对非均匀光照图像进行二值化进行并行优化。李真等人使用改进的同态滤波和自适应灰度变换法相结合的方法对图像做增强处理,然后再使用OTSU算法对图像进行二值化。熊炜等人利用最小均值法灰度化和双边滤波去噪进行预处理,然后通过形态学闭操作估计出图像背景,最后采用增广路算法求得最优二值图像。吴锐等人提出了一种基于谱聚类的图像二值化方法。潘梅森根据SOFM的聚类确定图像第一阈值作为循环迭代的初始值,对整幅图像进行循环迭代得到第二阈值,使用第二阈值对原始图像进行二值化。国外对字符识别中的二值化也有较多的研究。Sezgin和Sankur提出对图像选定某一固定阈值,并将此阈值与各像素值进行比较来获得二值化图像的方法。日本学者大津提出如果前景和背景之间的类间方差越大,就说明构成图像的两个部分之间的差别越大,当部分目标被错分为背景或部分背景被错分为目标,都会导致两部分差别变小,当所取阈值的分割使类间方差最大时就意味着错分概率最小。
然而,以上这些固定阈值的算法往往不能很好的适应光照的变化。因此为处理文档光照不均,学者们提出了一些自适应的二值化方法,但大部分的现有算法对字符的二值化处理还是比较粗糙。而Derek Bradley首先把积分图方法引入到二值化计算中,提出以W×W为模板的矩形区域的二维平滑值来代替一维加权值,对光照不均的情况下图像的二值化取得了较大的突破,但其处理结果还是会产生字迹笔画断笔、字迹浓淡不均等问题,对移动终端所在的复杂应用环境的适应能力还有待改进。
因此,需要提出一种新的基于自适应多阈值的字符识别预处理二值化方法。
发明内容
有鉴于此,本发明的目的是提供一种基于自适应多阈值的字符识别预处理二值化方法,通过一定尺寸的滑窗来获取像素点的正常阈值,引入松弛因子来评价当前点的光照变化情况,并根据前置点的权重值计算综合确定前景划分的松弛阈值,解决移动终端字符识别应用中光照不均匀,环境不可控导致的识别效果不佳的问题,并通过优化的获取积分图的方法,减小了计算松弛因子的时间开销,提高了对需进行字符识别的图像的二值化预处理的效率和精度,降低了后续精确识别字符的开销,提高字符识别的精度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆师范大学,未经重庆师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811242923.2/2.html,转载请声明来源钻瓜专利网。