[发明专利]一种电子文档图片去噪的方法和装置在审
申请号: | 201911094253.9 | 申请日: | 2019-11-11 |
公开(公告)号: | CN112785508A | 公开(公告)日: | 2021-05-11 |
发明(设计)人: | 陆瑾 | 申请(专利权)人: | 珠海金山办公软件有限公司;北京金山办公软件股份有限公司 |
主分类号: | G06T5/00 | 分类号: | G06T5/00;G06T5/30 |
代理公司: | 北京安信方达知识产权代理有限公司 11262 | 代理人: | 吴晓霞;栗若木 |
地址: | 519015 广东省珠*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 电子 文档 图片 方法 装置 | ||
1.一种电子文档图片去噪的方法,其特征在于,包括:
将所述电子文档图片转换成灰度图,并将得到的灰度图转换为二值化图;
根据所述二值化图,形成连通域图;
根据所述连通域图中的各个连通域确定疑似噪点区域;
根据所述疑似噪点区域对所述电子文档图片进行滤波处理,得到去噪后的文档图片。
2.根据权利要求1所述的方法,其特征在于,
所述将得到的灰度图转换为二值化图,包括:根据预设的转换阈值将所述灰度图转换为二值化图。
3.根据权利要求1或2所述的方法,其特征在于,
所述根据所述二值化图,形成连通域图,包括:
通过不同大小的结构元对所述二值化图依次进行腐蚀运算和膨胀运算,得到所述连通域图。
4.根据权利要求3所述的方法,其特征在于,
所述通过不同大小的结构元对所述二值化图依次进行腐蚀运算和膨胀运算,包括:
定义一个x*x的结构元,x为大于或等于2的整数,使用形态学的腐蚀算法对所述二值化图进行运算;
定义一个y*y的结构元,y为大于或等于1的整数,y小于x,通过形态学的膨胀算法对腐蚀算法处理后的二值化图进行运算,得到所述连通域图。
5.根据权利要求4所述的方法,其特征在于,
所述根据所述连通域图中的各个连通域确定疑似噪点区域,包括:
使用轮廓检测算法提取所述连通域图中各个连通域在连通域图中的位置坐标信息;
根据所述位置坐标信息,分别判断所述连通域图中的各个连通域是否为疑似噪点区域。
6.根据权利要求5所述的方法,其特征在于,
所述根据所述位置坐标信息,分别判断所述连通域图中的各个连通域是否为疑似噪点区域,包括:
根据所提取的各个连通域的位置坐标信息确定各个连通域的大小,将大小低于噪点阈值的连通域,定义为疑似噪点区域,标记为1,反之标记为0;
根据标记,针对整个连通域图形成噪点矩阵图;其中,所述噪点阈值根据所述电子文档图片的分辨率确定。
7.根据权利要求6所述的方法,其特征在于,
所述方法还包括:预设分辨率和噪点阈值的对应关系;
所述噪点阈值根据所述电子文档图片的分辨率确定,包括:根据电子文档图片的分辨率,依据预设的分辨率和噪点阈值的对应关系,确定对应的噪点阈值。
8.根据权利要求6所述的方法,其特征在于,
所述根据所述疑似噪点区域对所述电子文档图片进行滤波处理,得到去噪后的文档图片,包括:
对所述电子文档图片进行滤波处理,得到滤波结果图;
根据所述噪点矩阵图,将所述滤波结果图中非疑似噪点对应的区域的像素值都置为0,得到疑似区域结果图;
根据所述噪点矩阵图,将所述电子文档图片中疑似噪点对应的区域的像素值都置为0,得到非疑似区域结果图;
将所述疑似区域结果图和非疑似区域结果图进行矩阵加法运算,得到去噪后的文档图片。
9.根据权利要求1或8所述的方法,其特征在于,
所述滤波处理包括:中值滤波、均值滤波或高斯滤波。
10.一种电子文档图片去噪的装置,其特征在于,包括:
转换模块,设置为将所述电子文档图片转换成灰度图,并将得到的灰度图转换为二值化图;
连通域生成模块,设置为根据所述二值化图,形成连通域图;
噪点确定模块,设置为根据所述连通域图中的各个连通域确定疑似噪点区域;
去噪模块,设置为根据所述疑似噪点区域对所述电子文档图片进行滤波处理,得到去噪后的文档图片。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于珠海金山办公软件有限公司;北京金山办公软件股份有限公司,未经珠海金山办公软件有限公司;北京金山办公软件股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911094253.9/1.html,转载请声明来源钻瓜专利网。