[发明专利]文档图像页码迁移方法、服务器及存储介质有效
申请号: | 201910775308.6 | 申请日: | 2019-08-21 |
公开(公告)号: | CN110502658B | 公开(公告)日: | 2020-10-16 |
发明(设计)人: | 曾江佑;熊慧江;廖成慧 | 申请(专利权)人: | 江西博微新技术有限公司 |
主分类号: | G06F16/583 | 分类号: | G06F16/583;G06F16/51;G06K9/00 |
代理公司: | 北京久维律师事务所 11582 | 代理人: | 陈强 |
地址: | 330000 江西*** | 国省代码: | 江西;36 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文档 图像 页码 迁移 方法 服务器 存储 介质 | ||
本发明公开了一种文档图像页码迁移方法,应用于服务器,该方法包括获取对应的第一待识别区域及第二待识别区域,提取对应的第一页码区域及第二页码区域,对第一文档图像及第二文档图像进行一一配对,找到与第一文档图像匹配度最高的第二文档图像,将第一文档图像的第一页码区域替换到第二文档区域的第二页码区域,从第一图像集中获取未找到配对图像的第一文档图像的索引号n,将第一文档图像集中索引号n‑1的第一文档图像在第二文档图像集中对应的索引号为m的基础上+1得到的图像作为未找到配对图像的第一文档图像插入到第二图像集中的索引号位置。利用本发明具有能够不需要对已完成扫描去污的文档图像重新扫描去污,实现节省操作人员工作量的优点。
技术领域
本发明涉及图像处理技术领域,尤其涉及一种文档图像页码迁移方法、服务器及存储介质。
背景技术
文档图像在归档整理的过程中,需对每一页文档图像采用手写的方式编写页码,经过扫描后,使用图像处理软件对文档图像进行污渍清理,再整理成数字化文档。然而在实际流程中,可能出现遗漏文档图像的情况,当遗漏的文档图像按照正确顺序整理好后需要更改页码,造成之前完成去污处理的文档图像页码存在错误,需要重新对页码擦除编写、扫描、文档图像处理,耗时耗力。
因此,如何能够不需要对已完成扫描去污的文档图像重新扫描去污,实现节省操作人员工作量已经成为一个亟待解决的技术问题。
发明内容
本发明的主要目的在于提供一种文档图像页码迁移方法、服务器及存储介质,旨在如何能够不需要对已完成扫描去污的文档图像重新扫描去污,实现节省操作人员工作量的技术问题。
为实现上述目的,本发明提供的一种文档图像页码迁移方法,应用于服务器,该方法包括:
预处理步骤:分别获取至少一张重新编码的第一文档图像创建第一图像集,及获取至少一张去污处理的第二文档图像创建第二图像集,分别对所述第一文档图像及第二文档图像进行预处理得到对应的第一待识别区域及第二待识别区域;
识别步骤:利用预先训练的识别模型,分别识别提取出所述第一待识别区域上对应的第一页码区域,及所述第二待识别区域上对应的第二页码区域;
匹配步骤:利用预先确定的匹配算法对所述第一文档图像及第二文档图像进行一一配对,将每两张相似度小于或等于第一预设阈值的第一文档图像及第二文档图像归为同一组图像;
替换步骤:将所述同一组图像中第一文档图像的第一页码区域替换到第二文档区域的第二页码区域;及
补位步骤:生成每张所述第一文档图像及第二文档图像的索引号,当所述第一文档图像与第二文档图像完成一一配对后,从所述第一图像集中获取未找到配对图像的第一文档图像的索引号记为n,所述第二图像集的总索引号根据所述未找到配对图像的第一文档图像的数量相应增加,将所述第一文档图像集中索引号为n-1的第一文档图像在第二文档图像集中对应的索引号为 m的基础上+1得到的图像作为所述未找到配对图像的第一文档图像,并插入到所述第二图像集中的索引号位置。
优选地,所述识别模型由Lenet-5神经网络模型训练得到,所述Lenet-5 神经网络模型的训练过程如下:
获取预设数量的第一文档图像样本,每张第一文档图像样本中标注有第一页码区域;
将所述第一文档图像样本按照预设比例分成训练集和验证集,所述训练集中的图像样本数量大于所述验证集中的图像样本数量;
将所述训练集中的第一文档图像样本输入所述Lenet-5神经网络模型进行训练,每隔预设周期使用所述验证集对所述Lenet-5神经网络模型进行验证,利用所述验证集中各张第一文档图像和对应的第一页码区域对该识别模型的准确率进行验证;及
当验证的准确率大于第二预设阈值时,结束训练,得到所述识别模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江西博微新技术有限公司,未经江西博微新技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910775308.6/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序