[发明专利]一种基于深度学习的档案扫描件图像自动纠偏方法在审

专利信息
申请号: 202111508488.5 申请日: 2021-12-10
公开(公告)号: CN114358137A 公开(公告)日: 2022-04-15
发明(设计)人: 植煜焕;刘国平;裴伟;王志武 申请(专利权)人: 同略科技有限公司
主分类号: G06K9/62 分类号: G06K9/62;G06V10/774;G06V10/24;G06V10/20
代理公司: 昆明合众智信知识产权事务所 53113 代理人: 梁鹏钊
地址: 510000 广东省广州市天河区高普*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 深度 学习 档案 扫描 图像 自动 纠偏 方法
【权利要求书】:

1.一种基于深度学习的档案扫描件图像自动纠偏方法,其特征在于针对档案扫描件图像的成像的特点,提出通过将深度学习亮度分类结果去自适应调整图片的亮度,改善扫描件的亮度,并通过深度学习目标检测技术,检测扫描件全图的主成分,避免图片四周黑边或白边对后续图片纠偏角度估计的影响。设计两阶段的纠偏策略(大方向纠偏和小方向纠偏),完成对扫描件图片的纠偏,具体包括:

步骤一,将深度学习亮度分类结果去调整图片亮度,改善扫描件的亮度;

步骤二,标注扫描件的主要成分,进行深度学习训练得到模型后,检测得到扫描件的主要成分;

步骤三,深度学习模型进行第一阶段4个方向纠偏(大方向纠偏);

步骤四,深度学习联合像素投影纠偏(小方向纠偏)完成第二阶段的纠偏。

2.权利要求1所述一种基于深度学习的档案扫描件图像自动纠偏方法,其特征在于,步骤一所述的深度学习亮度分类指,收集真实场景中的档案扫描件图像8000张,然后分5个亮度等级,人工将图片分为5个对亮度类别,利用自行加深的VGG16深度网络进行训练,获得图片亮度分类网络模型(传统的VGG16包含了16个隐藏层(13个卷积层和3个全连接层),本专利自行加深的VGG网络有15个卷积层和5个全连接层。实验表明,如此加深后的分类网络,检测准确率提升了5%),然后利用该模型,对原始输入的图片进行深度学习模型推理,获得测试图片的深度学习亮度分类结果,设为Lever(简称L),Lever的范围为1~5。

3.权利要求1所述一种基于深度学习的档案扫描件图像自动纠偏方法,其特征在于,步骤一所述的将深度学习亮度分类结果去调整图片亮度指,利用自行加深的VGG深度学习分类网络所得的分类标签Lever值,去调整原始扫描件图片的亮度,调整的规则为,将Gamma矫正的指数值设置为基于深度学习所得结果L的式子:1/(5-L+1)。

4.权利要求1所述一种基于深度学习的档案扫描件图像自动纠偏方法,其特征在于,步骤二所述的标注扫描件的主要成分,进行深度学习训练得到模型后,检测得到扫描件的主要成分,指人工标注8000张原始扫描件中只需要保留的图像区域(主要成分),以用于后续深度学习的主成分检测训练数据。所述的检测得到扫描件的主要成分,指利用YOLOv2深度学习目标检测网络训练所标注的主成分,得到主成分检测模型,执行深度网络前向推理,以获得原始扫描图像的主要成分图像区域。

5.权利要求1所述一种基于深度学习的档案扫描件图像自动纠偏方法,其特征在于,步骤三所述的深度学习模型进行第一阶段4个方向纠偏(大方向纠偏)指,收集8000张0度偏斜的原始图片(若原始图片不为0度,则手工纠偏为0度),然后通过将图片顺时针旋转,得到另外90度、180度和270度偏斜的图片集合,结合原始图片集合,得到4类用于大方向纠偏的图片训练集合。从而用自行加深的VGG,训练对原始扫描件图片进行4方向分类的深度学习网络模型。进而,对每一张原始扫描件图片,利用该4方向分类深度学习网络对其进行4方向的分类,得到类标C(取值范围为0、1、2、3),从而根然后通过将图片逆时针旋转,即逆时针旋转C×90度,从而完成第一阶段4个方向的纠偏(大方向纠偏)。

6.权利要求1所述一种基于深度学习的档案扫描件图像自动纠偏方法,其特征在于,步骤四所述的深度学习联合像素投影纠偏(小方向纠偏)完成第二阶段的纠偏指,第二阶段的纠偏,在第一阶段纠偏得到的图像的基础上,分两个分支进行,第一分支,是使用自行加深的VGG深度学习网络实施91类小方向估计、第二分支是基于Sobel边缘投影法的小方向估计。当第一分支的结果与第二分支的结果相差小于5度时,采用第一分支的结果作为最终小纠偏角度估计,否则采用第二分支的结果作为最终的小纠偏角度估计,最终完成对小纠偏结果的选择。所述的自行加深的VGG深度学习网络实施91类小方向估计指收集16000张0度偏斜的原始图片(若原始图片不为0度,则手工纠偏为0度),然后通过将图片旋转,得到另外0~90度偏斜的图片集合,结合原始图片集合,得到91类用于大方向纠偏的图片训练集合。从而用自行加深的VGG,训练对原始扫描件图片进行91方向分类的深度学习网络模型。进而,对每一张原始扫描件图片,利用该4方向分类深度学习网络对其进行91方向的分类,得到类标C1(范围为整数的0~90),即对应得到使用自行加深的VGG深度学习网络实施91类小方向估计的结果。所述的基于Sobel边缘投影法的小方向估计指利用自行设计的Sobel加权分割算法对原始图像进行分割,然后对分割图像进行角度旋转遍历,进一步,对分割图的像素进行水平方向的像素值投影,并找到投影值为0值最多的纠偏方向,即为基于Sobel边缘投影法的小方向估计所得的偏角度。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于同略科技有限公司,未经同略科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202111508488.5/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top