[发明专利]一种档案图像自动裁边、校正、去噪和更换背景的方法在审
申请号: | 202111367420.X | 申请日: | 2021-11-18 |
公开(公告)号: | CN114066919A | 公开(公告)日: | 2022-02-18 |
发明(设计)人: | 杨玉东;任昊;刘占柱;韩锋;赵爽;李涛;焦东秋;周琼 | 申请(专利权)人: | 吉林省通联信用服务有限公司 |
主分类号: | G06T7/13 | 分类号: | G06T7/13;G06T7/136;G06T3/00;G06T5/00;G06T5/30 |
代理公司: | 长春众邦菁华知识产权代理有限公司 22214 | 代理人: | 于晓庆 |
地址: | 130000 吉林省长春市*** | 国省代码: | 吉林;22 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 档案 图像 自动 校正 更换 背景 方法 | ||
1.一种档案图像自动裁边、校正、去噪和更换背景的方法,其特征在于,包括:
步骤一、霍夫变换直线检测
拍摄纸质人事档案图像,利用霍夫变换检测直线,通过计算直线斜率判定直线倾斜角度,将图像旋转相应的倾斜角度使图像处于正方向;
步骤二、图像边缘检测
利用Canny算法对图像进行边缘检测,找到图像的边缘进行切割,并处理图像边缘的黑边;
步骤三、文字角度检测
利用深度学习模型识别图像中的文字角度,根据检测到的文字角度对文字进行相应旋转;
步骤四、更换背景
对图像进行分块,对每块图像做自适应阈值分割得到每块图像对应的阈值,将大于此阈值的像素值认定为文字或前景,将小于等于此阈值的像素值认定为背景,将小于等于此阈值的像素值认定为所要求的像素值。
2.根据权利要求1所述的一种档案图像自动裁边、校正、去噪和更换背景的方法,其特征在于,步骤一的具体操作流程如下:
拍摄纸质人事档案图像,将直线的方向θ离散化为有限个等间距的离散值,参数ρ对应离散化为有限个值,经过离散化后参数空间不再是连续的,而是被离散量化为多个相同大小的网格单元;将图像空间中每个像素点的坐标值变换到参数空间后,所得值落在某个网格单元内,使该网格单元的累加计数器加1;当图像空间中所有的像素都经过霍夫变换后,对网格单元进行检查,累加计数值最大的网格,其坐标值(ρ0,θ0)对应的就是图像空间中所求的直线,通过计算直线斜率判定直线倾斜角度,通过上述处理后的图像与正方向的倾斜角度是0°、90°、180°或270°,将图像旋转相应的倾斜角度使图像处于正方向。
3.根据权利要求2所述的一种档案图像自动裁边、校正、去噪和更换背景的方法,其特征在于,步骤二的具体操作流程如下:
S2.1图像去噪
计算图像梯度,得到可能的边缘,得到所有可能边缘的集合;
S2.2非极大值抑制
灰度变化的地方比较集中,将局部范围内的梯度方向上灰度变化最大的地方保留下来,其它的地方不保留,剔除掉一大部分的点;将有多个像素宽的边缘变成一个单像素宽的边缘;
S2.3双阈值筛选
通过非极大值抑制后,会有很多可能的边缘点,进一步设置一个双阈值,即低阈值和高阈值;灰度变化大于高阈值的,则设为强边缘像素;灰度变化低于低阈值的,则将其剔除;灰度变化在低阈值和高阈值之间的,则设为弱边缘。进一步判断,若其邻域内有强边缘像素,则保留,如果没有,则剔除;使得边缘尽可能的闭合。
4.根据权利要求3所述的一种档案图像自动裁边、校正、去噪和更换背景的方法,其特征在于,步骤三的具体操作流程如下:
利用深度学习模型中的VGG-16网络识别图像中的文字角度,整个VGG-16网络包括13层卷积层和3层全连接层,卷积层采用相同大小的卷积核尺寸和最大池化尺寸,激活函数使用Relu函数;深度学习模型训练过程中减小卷积核大小同时加深网络层;训练数据使用5591个字符,包括5529个常用的中文汉字、10个阿拉伯数字、26个大写英文字母和26个小写英文字母,每个字符的每个方向分别使用5种不同字体生成30个不同的图像。
5.根据权利要求4所述的一种档案图像自动裁边、校正、去噪和更换背景的方法,其特征在于,所述字体包括宋体、微软雅黑、仿宋、黑体和楷体。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于吉林省通联信用服务有限公司,未经吉林省通联信用服务有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111367420.X/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序