[发明专利]一种基于深度学习的档案扫描件图像自动纠偏方法在审
申请号: | 202111508488.5 | 申请日: | 2021-12-10 |
公开(公告)号: | CN114358137A | 公开(公告)日: | 2022-04-15 |
发明(设计)人: | 植煜焕;刘国平;裴伟;王志武 | 申请(专利权)人: | 同略科技有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06V10/774;G06V10/24;G06V10/20 |
代理公司: | 昆明合众智信知识产权事务所 53113 | 代理人: | 梁鹏钊 |
地址: | 510000 广东省广州市天河区高普*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 档案 扫描 图像 自动 纠偏 方法 | ||
1.一种基于深度学习的档案扫描件图像自动纠偏方法,其特征在于针对档案扫描件图像的成像的特点,提出通过将深度学习亮度分类结果去自适应调整图片的亮度,改善扫描件的亮度,并通过深度学习目标检测技术,检测扫描件全图的主成分,避免图片四周黑边或白边对后续图片纠偏角度估计的影响。设计两阶段的纠偏策略(大方向纠偏和小方向纠偏),完成对扫描件图片的纠偏,具体包括:
步骤一,将深度学习亮度分类结果去调整图片亮度,改善扫描件的亮度;
步骤二,标注扫描件的主要成分,进行深度学习训练得到模型后,检测得到扫描件的主要成分;
步骤三,深度学习模型进行第一阶段4个方向纠偏(大方向纠偏);
步骤四,深度学习联合像素投影纠偏(小方向纠偏)完成第二阶段的纠偏。
2.权利要求1所述一种基于深度学习的档案扫描件图像自动纠偏方法,其特征在于,步骤一所述的深度学习亮度分类指,收集真实场景中的档案扫描件图像8000张,然后分5个亮度等级,人工将图片分为5个对亮度类别,利用自行加深的VGG16深度网络进行训练,获得图片亮度分类网络模型(传统的VGG16包含了16个隐藏层(13个卷积层和3个全连接层),本专利自行加深的VGG网络有15个卷积层和5个全连接层。实验表明,如此加深后的分类网络,检测准确率提升了5%),然后利用该模型,对原始输入的图片进行深度学习模型推理,获得测试图片的深度学习亮度分类结果,设为Lever(简称L),Lever的范围为1~5。
3.权利要求1所述一种基于深度学习的档案扫描件图像自动纠偏方法,其特征在于,步骤一所述的将深度学习亮度分类结果去调整图片亮度指,利用自行加深的VGG深度学习分类网络所得的分类标签Lever值,去调整原始扫描件图片的亮度,调整的规则为,将Gamma矫正的指数值设置为基于深度学习所得结果L的式子:1/(5-L+1)。
4.权利要求1所述一种基于深度学习的档案扫描件图像自动纠偏方法,其特征在于,步骤二所述的标注扫描件的主要成分,进行深度学习训练得到模型后,检测得到扫描件的主要成分,指人工标注8000张原始扫描件中只需要保留的图像区域(主要成分),以用于后续深度学习的主成分检测训练数据。所述的检测得到扫描件的主要成分,指利用YOLOv2深度学习目标检测网络训练所标注的主成分,得到主成分检测模型,执行深度网络前向推理,以获得原始扫描图像的主要成分图像区域。
5.权利要求1所述一种基于深度学习的档案扫描件图像自动纠偏方法,其特征在于,步骤三所述的深度学习模型进行第一阶段4个方向纠偏(大方向纠偏)指,收集8000张0度偏斜的原始图片(若原始图片不为0度,则手工纠偏为0度),然后通过将图片顺时针旋转,得到另外90度、180度和270度偏斜的图片集合,结合原始图片集合,得到4类用于大方向纠偏的图片训练集合。从而用自行加深的VGG,训练对原始扫描件图片进行4方向分类的深度学习网络模型。进而,对每一张原始扫描件图片,利用该4方向分类深度学习网络对其进行4方向的分类,得到类标C(取值范围为0、1、2、3),从而根然后通过将图片逆时针旋转,即逆时针旋转C×90度,从而完成第一阶段4个方向的纠偏(大方向纠偏)。
6.权利要求1所述一种基于深度学习的档案扫描件图像自动纠偏方法,其特征在于,步骤四所述的深度学习联合像素投影纠偏(小方向纠偏)完成第二阶段的纠偏指,第二阶段的纠偏,在第一阶段纠偏得到的图像的基础上,分两个分支进行,第一分支,是使用自行加深的VGG深度学习网络实施91类小方向估计、第二分支是基于Sobel边缘投影法的小方向估计。当第一分支的结果与第二分支的结果相差小于5度时,采用第一分支的结果作为最终小纠偏角度估计,否则采用第二分支的结果作为最终的小纠偏角度估计,最终完成对小纠偏结果的选择。所述的自行加深的VGG深度学习网络实施91类小方向估计指收集16000张0度偏斜的原始图片(若原始图片不为0度,则手工纠偏为0度),然后通过将图片旋转,得到另外0~90度偏斜的图片集合,结合原始图片集合,得到91类用于大方向纠偏的图片训练集合。从而用自行加深的VGG,训练对原始扫描件图片进行91方向分类的深度学习网络模型。进而,对每一张原始扫描件图片,利用该4方向分类深度学习网络对其进行91方向的分类,得到类标C1(范围为整数的0~90),即对应得到使用自行加深的VGG深度学习网络实施91类小方向估计的结果。所述的基于Sobel边缘投影法的小方向估计指利用自行设计的Sobel加权分割算法对原始图像进行分割,然后对分割图像进行角度旋转遍历,进一步,对分割图的像素进行水平方向的像素值投影,并找到投影值为0值最多的纠偏方向,即为基于Sobel边缘投影法的小方向估计所得的偏角度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于同略科技有限公司,未经同略科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111508488.5/1.html,转载请声明来源钻瓜专利网。