[发明专利]一种电子文档图片去噪的方法和装置在审

专利信息
申请号: 201911094253.9 申请日: 2019-11-11
公开(公告)号: CN112785508A 公开(公告)日: 2021-05-11
发明(设计)人: 陆瑾 申请(专利权)人: 珠海金山办公软件有限公司;北京金山办公软件股份有限公司
主分类号: G06T5/00 分类号: G06T5/00;G06T5/30
代理公司: 北京安信方达知识产权代理有限公司 11262 代理人: 吴晓霞;栗若木
地址: 519015 广东省珠*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 电子 文档 图片 方法 装置
【说明书】:

发明公开了一种电子文档图片去噪的方法,包括:将所述电子文档图片转换成灰度图,并将得到的灰度图转换为二值化图;根据所述二值化图,形成连通域图;根据所述连通域图中的各个连通域确定疑似噪点区域;根据所述疑似噪点区域对所述电子文档图片进行滤波处理,得到去噪后的文档图片。本发明还公开了一种电子文档图片去噪的装置。

技术领域

本发明涉及电子文档处理领域,尤其涉及一种电子文档图片去噪的方法和装置。

背景技术

图像在生成和传输过程中常常因受到各种噪声的干扰和影响而使图像降质,这对后续图像的处理和图像视觉效应将产生不利影响,如对后续的图像分割、目标识别、边缘提取、光学字符识别(Optical Character Recognition,OCR)等将产生不利影响。所以,为了获取高质量数字图像,很有必要对图像进行降噪处理,尽可能的保持原始信息完整性的同时,又能够去除图像中干扰的信息。

图像去噪的最终目的是改善给定的图像,解决实际图像由于噪声干扰而导致图像质量下降的问题。更好的体现原来图像所携带的信息,是一种重要的预处理手段。

在现有的去噪算法中,主要是针对照片、图片去噪,有的去噪算法在低维信号图像处理中取得较好的效果,却不适用于高维信号图像处理;或者,去噪效果较好,却丢失部分图像边缘信息。本领域中存在一些相关的去噪算法,例如:基于空间域的方法,如中值滤波、均值滤波、高斯滤波等,基于小波域的小波阈值去噪,以及基于变分法思想的ROF(Rudin-Osher-Fatemi)去噪算法。由于这类平滑滤波器会使得边缘变得平滑,当应用到电子文档中去噪时,对于文字这种包含大量点、尖笔画的情况,会使得文字笔画模糊;如要保留笔画,则去噪效果不佳。在电子文档中,主要都是文字信息,边缘细节信息尤为重要,而在OCR识别文档中的文字信息时,噪点会造成很大的干扰。

现在技术方案中,没有专门针对电子文档的特点而提出的去噪方案。因此,为了有效提升电子文档OCR文字识别的准确率,改善电子文档的阅读效果,需要有区别于一般图像的去噪方案,既能使电子文档中文字、符号等细节信息不模糊,又能去除污点噪声的去噪方法。

发明内容

鉴于上述问题,本发明提供一种电子文档图片去噪的方法和装置,解决了针对电子文档图片特点的去噪方案,既能使电子文档中文字、符号等细节信息不模糊,又能去除污点噪声。

为了解决上述问题,本发明提供了一种电子文档图片去噪的方法,包括:

将所述电子文档图片转换成灰度图,并将得到的灰度图转换为二值化图;

根据所述二值化图,形成连通域图;

根据所述连通域图中的各个连通域确定疑似噪点区域;

根据所述疑似噪点区域对所述电子文档图片进行滤波处理,得到去噪后的文档图片。

可选地,所述将得到的灰度图转换为二值化图,包括:根据预设的转换阈值将所述灰度图转换为二值化图。

可选地,所述根据所述二值化图,形成连通域图,包括:

通过不同大小的结构元对所述二值化图依次进行腐蚀运算和膨胀运算,得到所述连通域图。

可选地,所述通过不同大小的结构元对所述二值化图依次进行腐蚀运算和膨胀运算,包括:

定义一个x*x的结构元,x为大于或等于2的整数,使用形态学的腐蚀算法对所述二值化图进行运算;

定义一个y*y的结构元,y为大于或等于1的整数,y小于x,通过形态学的膨胀算法对腐蚀算法处理后的二值化图进行运算,得到所述连通域图。

可选地,所述根据所述连通域图中的各个连通域确定疑似噪点区域,包括:

使用轮廓检测算法提取所述连通域图中各个连通域在连通域图中的位置坐标信息;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于珠海金山办公软件有限公司;北京金山办公软件股份有限公司,未经珠海金山办公软件有限公司;北京金山办公软件股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201911094253.9/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top