[发明专利]一种扫描文档的裁边方法与系统在审
申请号: | 201911290750.6 | 申请日: | 2019-12-16 |
公开(公告)号: | CN111062317A | 公开(公告)日: | 2020-04-24 |
发明(设计)人: | 李子印;王启真;孔繁圣;邹细勇;杨凯;陈亮 | 申请(专利权)人: | 中国计量大学上虞高等研究院有限公司;中国计量大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/46;G06K9/44;G06K9/38;G06K9/32;G06T7/136 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 312300 浙江省绍兴市上虞区曹娥街*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 扫描 文档 方法 系统 | ||
本发明公开了一种扫描文档的裁边方法与系统,以解决扫描文档的裁边效率低的问题。方法包括:把扫描得文件转换为图片格式,对图片进行灰度化,并使用改进的Canny算子提取边缘,找到边缘的最小面积包围矩形,并且计算矩形的中心,以及旋转的角度。对原始图片以矩形的中心旋转相应的角度,得到无倾斜的图片。对无倾斜图片二值化,得到矩形的边缘点,找到最小包围矩形,以最小包围矩形裁剪图片,得到裁边之后的图片文档。同时计算矩形的面积,用于判断是否裁剪失败,如果矩形面积与标准纸张的面积差别大于2%,判定为裁剪失败,进行人工手动裁剪。本发明提高了扫描文件切边的效率,并且能够尽可能多地鉴别出切边失败的文件,提高扫描切边文件的准确性。
技术领域
本发明涉及图像处理领域,具体涉及一种扫描文档的裁边技术。
背景技术
在当今社会,纸质资料的弊端逐渐显现。纸质材料的存储需要占用大量的空间,纸质材料在储存过程中容易受到环境因素的影响,造成不同程度的损坏。这些问题都给纸质材料的完整性带来巨大的威胁。并且在查阅的时候是非常费时费力的。
传统方法为了更完整的保存纸质材料需要投入巨大的财力、物力去建造专门的存放场所,并且要配备专业的人员对场所进行维护与管理。
与纸质材料的存储与管理相比,电子材料在存储空间上表现出相当大的优越性。电子材料一般存储在硬盘与云端。这样也就免去了建造专门的场所、雇佣专业的管理人员的麻烦。
为了将一些纸质资料转化为电子资料,一般先使用扫描仪对纸质材料进行扫描,然后对生成的电子文件进行保存。扫描仪在对被扫描文件自动生成电子文件的同时会在电子文件外围添加一周的外框(白边),大部分时间我们只得到扫描文件而不需要添加外框。这个时候人们就会手动去裁剪电子文件的尺寸大小。这样做不仅费时费力并且效率和准确率都很难让人满意。
发明内容
鉴于上面提及的问题,提出了一种扫描文档的裁边方法为了克服或者部分的解决上述问题。
根据本发明的一个方面,提出了一种扫描文档的裁边方法,包括:
针对扫描得到的电子文件,将其转换为图片格式的文件;
利用灰度变换把彩色图像变为灰度图像;
对灰度图进行轮廓检测,由于扫描得到的图像整体偏亮,对比度不高。因此图像中存在弱边缘,虽然人眼能够观察到弱边缘的存在,但对图像作边缘检测时,会导致将弱边缘划分成非边缘,得到的边缘图像可能有间断,甚至会漏检一些倾斜的边缘。因此,在作边缘检测时为了更好地检测出图像中的弱边缘,提出了一种基于Canny的弱边缘检测改进算法。
改进的Canny算法流程图如图1所示。
每一幅图像在拍摄的时候,都会不可避免的受到噪声的干扰。为了去除噪声并且尽可能多的保留边缘信息,增强边缘,使用双边滤波去噪。
g(i,j)代表输出点的灰度值,f(k,l)代表输入点的灰度值,S(i,j)是指以(i,j)为中心的(2N+1)*(2N+1)的大小的范围,N代表(i,j)的邻域半径。
加权系数ω(i,j,k,l)是空域核与值域核的乘积,
ωd为空间距离高斯函数:
ωr为像素值相似度高斯函数:
其中(i,j)为输出点位置,(k,l)为输入点的位置,为空间域标准差,为值域标准差。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国计量大学上虞高等研究院有限公司;中国计量大学,未经中国计量大学上虞高等研究院有限公司;中国计量大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911290750.6/2.html,转载请声明来源钻瓜专利网。