[发明专利]一种基于深度残差网络的文字透底现象去除方法在审
申请号: | 201910378389.6 | 申请日: | 2019-05-08 |
公开(公告)号: | CN110119704A | 公开(公告)日: | 2019-08-13 |
发明(设计)人: | 韩波;孙毓钊 | 申请(专利权)人: | 武汉大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/36;G06K9/42;G06K9/62 |
代理公司: | 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 | 代理人: | 罗飞 |
地址: | 430072 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 去除 残差 训练数据 噪声 网络数据获取 辅助数据集 统计学理论 辅助数据 模拟生成 生成算法 数据可用 网络设计 训练过程 噪声生成 噪声数据 普适性 数据集 构建 算法 网络 图像 | ||
本发明公开了一种基于深度残差网络的文字透底现象去除方法,其步骤包括:从网络数据获取文字透底数据和辅助数据集,进行数据集划分,基于统计学理论和深度残差网络设计文字透底现象去除模型,利用噪声数据生成算法生成带有噪声的训练数据,利用带有噪声的训练数据对文字透底现象去除模型进行训练,获得训练后的文字透底现象去除模型,利用训练后的文字透底现象去除模型对待处理的图像进行文字透底现象去除。本发明的优点有:构建的模型运行所需的资源较少、且用于文字透底现象去除效果显著;提供的方法具有一定的普适性,易于推广;在模型的训练过程中需要的辅助数据较少,训练所需的数据可用噪声生成算法来模拟生成,具有非常大的实用意义。
技术领域
本发明涉及计算机图像处理技术领域,具体涉及一种基于深度残差网络的文字透底现象去除方法。
背景技术
在日常生活中,我们在扫描文件或书稿的时候,如果纸张太薄,就容易将文件背面的文字也模模糊糊地映在正面,从而形成正面也有模糊背面文字的图像,这也就是通常所说的“文字透底”现象。文字透底现象会给人们的研究和生活带来很多问题,例如光学字符识别技术,即OCR技术,会通过对文稿或书本等图片进行扫描分析,然后获取图片上文字内容。对于出现文字透底现象的图片,OCR技术就会因为背景文字的原因产生非常差的效果。
这些年来,文字透底问题一直尚未得到有效的解决。现有技术中,在数字图像处理方面,有学者尝试对图像进行二值化处理的方式,来达到消除背景文字的效果,不过受用的场景非常少。也有国外学者对这类问题做了相关研究,提出自适应线性滤波方案,通过获取并记录正反两面的图像,再使用自适应线性滤波算法来处理两张图像,达到消除文字透底现象的目的。本申请发明人在实施本发明的过程中,发现现有技术的方法,至少存在如下技术问题:现有的线性滤波方案,对正反两面图像质量有一定的要求限制,例如分辨率、背景文字在正面图像上的相对位置等,同时算法具有一定的局限性,适用范围小,从而并未受到广泛的普及。
由此可知,现有技术中的方法存在应用范围窄以及效果较差的技术问题。
发明内容
有鉴于此,本发明提供了一种基于深度残差网络的文字透底现象去除方法,用以解决或者至少部分解决现有技术中的方法存在的应用范围窄以及效果较差的技术问题。
本发明提供了一种基于深度残差网络的文字透底现象去除方法,包括:
步骤S1:从网络数据中获取文字透底数据和辅助数据集;
步骤S2:对辅助数据集进行预处理后,按照预设划分比例划分为训练数据集和验证数据集,将文字透底数据作为测试数据集;
步骤S3:从训练数据集中选取出数据,并为选取出的数据添加一对分布相同的噪声,构成带有噪声的训练数据;
步骤S4:基于统计学理论和深度残差网络,设计神经网络结构和损失函数,构建文字透底现象去除模型;
步骤S5:设置模型参数,利用带有噪声的训练数据对文字透底现象去除模型进行训练,获得训练后的文字透底现象去除模型;
步骤S6:利用步骤S5中训练后的文字透底现象去除模型对待处理的图像进行文字透底现象去除。
在一种实施方式中,步骤S2对辅助数据集进行预处理,具体包括:
对辅助数据集进行清洗,抽取出预设数量的清晰数据,并对于尺寸超过阈值的图片,按照预设比例重新调整大小。
在一种实施方式中,步骤S3的具体实现过程包括以下子步骤:
步骤S3.1:通过预设程序生成一对噪声数据;
步骤S3.2:将生成的噪声数据与选取出的数据进行相加,构成输入输出对,将其作为带有噪声的训练数据。
在一种实施方式中,步骤S4的具体实现过程包括以下子步骤:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉大学,未经武汉大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910378389.6/2.html,转载请声明来源钻瓜专利网。