[发明专利]一种单模板工作流预处理优化方法在审
申请号: | 202110196494.5 | 申请日: | 2021-02-22 |
公开(公告)号: | CN112801108A | 公开(公告)日: | 2021-05-14 |
发明(设计)人: | 玄洪升;李明明;潘心冰;顾英健;冷静 | 申请(专利权)人: | 浪潮云信息技术股份公司 |
主分类号: | G06K9/34 | 分类号: | G06K9/34;G06K9/46 |
代理公司: | 济南信达专利事务所有限公司 37100 | 代理人: | 姜鹏 |
地址: | 250100 山东省济南市高*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 模板 工作流 预处理 优化 方法 | ||
本发明涉及图像文字识别和深度学习领域,具体提供了一种单模板工作流预处理优化方法,具有以下步骤:S1、采用非对称的自适应中值滤波的方法改善图像的前景目标与背景之间的边缘特性;S2、提取邻域范围内水平和竖直方向的灰度波动曲线,再根据灰度波动曲线,统计所有的波峰点和波谷点信息;S3、接着确定当前邻域范围内的阈值;S4、通过局部阈值分割来确定图像中的前景目标边缘;S5、将行与列的分割结果取交集得到非均匀光照图像二值化的最终结果。与现有技术相比,本发明基于多方向灰度波动优化单模板工作流的预处理效果,提高单模板工作流识别模型的精度,保证结构化信息的提取效果。
技术领域
本发明涉及图像文字识别和深度学习领域,具体提供一种单模板工作流预处理优化方法。
背景技术
单模板工作流能够自主构建文字识别模板,识别模板图片中的文字,提供高精度的文字识别模型,保证结构化信息提取精度,其中,图像二值化是单模板工作流预处理阶段的关键步骤,其中对非均匀光照图像的二值化更为关键和困难,因为光照不均匀将直接或间接影响到版式图片中的文字识别及文字识别模板的构建。
在实际拍摄过程中,由于光照方向、拍摄角度、物体表面反射等因素,往往使得采集的图像出现局部过亮、局部过暗、明暗交错等光照不均匀现象,严重影响后续处理,完整有效地提取出高质量的文本信息无疑对单模板工作流的文字识别模型精度起着关键作用。
发明内容
本发明是针对上述现有技术的不足,提供一种一种实用性强的单模板工作流预处理优化方法。
本发明解决其技术问题所采用的技术方案是:
一种单模板工作流预处理优化方法,具有以下步骤:
S1、采用非对称的自适应中值滤波的方法改善图像的前景目标与背景之间的边缘特性;
S2、提取邻域范围内水平和竖直方向的灰度波动曲线,再根据灰度波动曲线,统计所有的波峰点和波谷点信息;
S3、接着确定当前邻域范围内的阈值;
S4、通过局部阈值分割来确定图像中的前景目标边缘;
S5、将行与列的分割结果取交集得到非均匀光照图像二值化的最终结果。
进一步的,在步骤S1中,对较亮的前景目标区域采用小模板窗的中值滤波处理,对较暗的背景区域则采用动态扩大的模板窗口进行滤波。
进一步的,在步骤S2中,首先按行或列搜索灰度波动的所有谷峰点,连续曲线的峰和波谷是曲线的极值点,满足一阶倒数为0,并且二阶倒数为负的点为峰值点;满足一阶倒数为0,并且二阶倒数正数的点为峰谷点;
曲线是离散的,使用求差分函数来求解,确定峰值点和峰谷点,确定大尺度的波谷波峰,从图像的灰度波动特征提取大尺度的峰谷点,从而确定目标的边缘。
进一步的,筛除小尺度的峰谷点时,在灰度波动曲线的上升沿河下降沿,如果相邻的波峰和波谷点,其灰度差小于极小值ε,则合并取消,去除伪波谷波峰点,将经过筛选后所剩下的峰谷点按列坐标升序排列,放入队列D中,在队列D中进一步合并消除灰度差小于ε的相邻峰谷点,最后获得的大尺度峰谷点保存在队列Q中,这些峰谷点标记了目标边缘的位置。
进一步的,在步骤S3中,通过灰度波动曲线提取最大限度的目标考察点水平和竖直范围内的所有有价值的波峰点和波谷点,包含图像重要的边缘信息,突变的点是光照不均匀的直接反映。
进一步的,在获得目标边缘的大尺度波峰波谷点之后,为了进一步分割出目标,设计目标分割的局部阈值,如公式1:
T=g(t)+ξ×(g(p)-g(t)) (1)
公式中,t和p为Q队列中的位置相邻的大尺度波谷点和波峰点,g(t)表示波谷点的灰度值,g(p)表示波谷点的灰度值,0ζ1。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浪潮云信息技术股份公司,未经浪潮云信息技术股份公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110196494.5/2.html,转载请声明来源钻瓜专利网。