[发明专利]一种基于深度学习的档案扫描件图像自动纠偏方法在审

申请号：	202111508488.5	申请日：	2021-12-10
公开（公告）号：	CN114358137A	公开（公告）日：	2022-04-15
发明（设计）人：	植煜焕;刘国平;裴伟;王志武	申请（专利权）人：	同略科技有限公司
主分类号：	G06K9/62	分类号：	G06K9/62;G06V10/774;G06V10/24;G06V10/20
代理公司：	昆明合众智信知识产权事务所 53113	代理人：	梁鹏钊
地址：	510000 广东省广州市天河区高普***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于深度学习档案扫描图像自动纠偏方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于深度学习的档案扫描件图像自动纠偏方法，其特征在于针对档案扫描件图像的成像的特点，提出通过将深度学习亮度分类结果去自适应调整图片的亮度，改善扫描件的亮度，并通过深度学习目标检测技术，检测扫描件全图的主成分，避免图片四周黑边或白边对后续图片纠偏角度估计的影响。设计两阶段的纠偏策略(大方向纠偏和小方向纠偏)，完成对扫描件图片的纠偏，具体包括：

步骤一，将深度学习亮度分类结果去调整图片亮度，改善扫描件的亮度；

步骤二，标注扫描件的主要成分，进行深度学习训练得到模型后，检测得到扫描件的主要成分；

步骤三，深度学习模型进行第一阶段4个方向纠偏(大方向纠偏)；

步骤四，深度学习联合像素投影纠偏(小方向纠偏)完成第二阶段的纠偏。

2.权利要求1所述一种基于深度学习的档案扫描件图像自动纠偏方法，其特征在于，步骤一所述的深度学习亮度分类指，收集真实场景中的档案扫描件图像8000张，然后分5个亮度等级，人工将图片分为5个对亮度类别，利用自行加深的VGG16深度网络进行训练，获得图片亮度分类网络模型(传统的VGG16包含了16个隐藏层(13个卷积层和3个全连接层)，本专利自行加深的VGG网络有15个卷积层和5个全连接层。实验表明，如此加深后的分类网络，检测准确率提升了5％)，然后利用该模型，对原始输入的图片进行深度学习模型推理，获得测试图片的深度学习亮度分类结果，设为Lever(简称L)，Lever的范围为1～5。

3.权利要求1所述一种基于深度学习的档案扫描件图像自动纠偏方法，其特征在于，步骤一所述的将深度学习亮度分类结果去调整图片亮度指，利用自行加深的VGG深度学习分类网络所得的分类标签Lever值，去调整原始扫描件图片的亮度，调整的规则为，将Gamma矫正的指数值设置为基于深度学习所得结果L的式子：1/(5-L+1)。

4.权利要求1所述一种基于深度学习的档案扫描件图像自动纠偏方法，其特征在于，步骤二所述的标注扫描件的主要成分，进行深度学习训练得到模型后，检测得到扫描件的主要成分，指人工标注8000张原始扫描件中只需要保留的图像区域(主要成分)，以用于后续深度学习的主成分检测训练数据。所述的检测得到扫描件的主要成分，指利用YOLOv2深度学习目标检测网络训练所标注的主成分，得到主成分检测模型，执行深度网络前向推理，以获得原始扫描图像的主要成分图像区域。

5.权利要求1所述一种基于深度学习的档案扫描件图像自动纠偏方法，其特征在于，步骤三所述的深度学习模型进行第一阶段4个方向纠偏(大方向纠偏)指，收集8000张0度偏斜的原始图片(若原始图片不为0度，则手工纠偏为0度)，然后通过将图片顺时针旋转，得到另外90度、180度和270度偏斜的图片集合，结合原始图片集合，得到4类用于大方向纠偏的图片训练集合。从而用自行加深的VGG，训练对原始扫描件图片进行4方向分类的深度学习网络模型。进而，对每一张原始扫描件图片，利用该4方向分类深度学习网络对其进行4方向的分类，得到类标C(取值范围为0、1、2、3)，从而根然后通过将图片逆时针旋转，即逆时针旋转C×90度，从而完成第一阶段4个方向的纠偏(大方向纠偏)。

6.权利要求1所述一种基于深度学习的档案扫描件图像自动纠偏方法，其特征在于，步骤四所述的深度学习联合像素投影纠偏(小方向纠偏)完成第二阶段的纠偏指，第二阶段的纠偏，在第一阶段纠偏得到的图像的基础上，分两个分支进行，第一分支，是使用自行加深的VGG深度学习网络实施91类小方向估计、第二分支是基于Sobel边缘投影法的小方向估计。当第一分支的结果与第二分支的结果相差小于5度时，采用第一分支的结果作为最终小纠偏角度估计，否则采用第二分支的结果作为最终的小纠偏角度估计，最终完成对小纠偏结果的选择。所述的自行加深的VGG深度学习网络实施91类小方向估计指收集16000张0度偏斜的原始图片(若原始图片不为0度，则手工纠偏为0度)，然后通过将图片旋转，得到另外0～90度偏斜的图片集合，结合原始图片集合，得到91类用于大方向纠偏的图片训练集合。从而用自行加深的VGG，训练对原始扫描件图片进行91方向分类的深度学习网络模型。进而，对每一张原始扫描件图片，利用该4方向分类深度学习网络对其进行91方向的分类，得到类标C1(范围为整数的0～90)，即对应得到使用自行加深的VGG深度学习网络实施91类小方向估计的结果。所述的基于Sobel边缘投影法的小方向估计指利用自行设计的Sobel加权分割算法对原始图像进行分割，然后对分割图像进行角度旋转遍历，进一步，对分割图的像素进行水平方向的像素值投影，并找到投影值为0值最多的纠偏方向，即为基于Sobel边缘投影法的小方向估计所得的偏角度。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于同略科技有限公司，未经同略科技有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202111508488.5/1.html，转载请声明来源钻瓜专利网。

上一篇：基于废纸的复合形貌纳米纤维素透明薄膜及其制备方法
下一篇：胃轻瘫用5-HT4受体激动剂

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于深度学习的档案扫描件图像自动纠偏方法在审

专利文献下载