[发明专利]文档图像页码迁移方法、服务器及存储介质有效
申请号: | 201910775308.6 | 申请日: | 2019-08-21 |
公开(公告)号: | CN110502658B | 公开(公告)日: | 2020-10-16 |
发明(设计)人: | 曾江佑;熊慧江;廖成慧 | 申请(专利权)人: | 江西博微新技术有限公司 |
主分类号: | G06F16/583 | 分类号: | G06F16/583;G06F16/51;G06K9/00 |
代理公司: | 北京久维律师事务所 11582 | 代理人: | 陈强 |
地址: | 330000 江西*** | 国省代码: | 江西;36 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文档 图像 页码 迁移 方法 服务器 存储 介质 | ||
1.一种文档图像页码迁移方法,应用于服务器,其特征在于,该方法包括:
预处理步骤:分别获取至少一张重新编码的第一文档图像创建第一图像集,及获取至少一张去污处理的第二文档图像创建第二图像集,分别对所述第一文档图像及第二文档图像进行预处理得到对应的第一待识别区域及第二待识别区域;
识别步骤:利用预先训练的识别模型,分别识别提取出所述第一待识别区域上对应的第一页码区域,及所述第二待识别区域上对应的第二页码区域;
匹配步骤:利用预先确定的匹配算法对所述第一文档图像及第二文档图像进行一一配对,将每两张相似度小于或等于第一预设阈值的第一文档图像及第二文档图像归为同一组图像;
替换步骤:将所述同一组图像中第一文档图像的第一页码区域替换到第二文档区域的第二页码区域;及
补位步骤:生成每张所述第一文档图像及第二文档图像的索引号,当所述第一文档图像与第二文档图像完成一一配对后,从所述第一图像集中获取未找到配对图像的第一文档图像的索引号记为n,所述第二图像集的总索引号根据所述未找到配对图像的第一文档图像的数量相应增加,将所述第一文档图像集中索引号为n-1的第一文档图像在第二文档图像集中对应的索引号为m的基础上+1得到的图像作为所述未找到配对图像的第一文档图像,并插入到所述第二图像集中的索引号位置。
2.如权利要求1所述的文档图像页码迁移方法,其特征在于,所述识别模型由Lenet-5神经网络模型训练得到,所述Lenet-5神经网络模型的训练过程如下:
获取预设数量的第一文档图像样本,每张第一文档图像样本中标注有第一页码区域;
将所述第一文档图像样本按照预设比例分成训练集和验证集,所述训练集中的图像样本数量大于所述验证集中的图像样本数量;
将所述训练集中的第一文档图像样本输入所述Lenet-5神经网络模型进行训练,每隔预设周期使用所述验证集对所述Lenet-5神经网络模型进行验证,利用所述验证集中各张第一文档图像和对应的第一页码区域对该识别模型的准确率进行验证;及
当验证的准确率大于第二预设阈值时,结束训练,得到所述识别模型。
3.如权利要求1所述的文档图像页码迁移方法,其特征在于,所述匹配算法为SURF算法,通过所述SURF算法分别得出每张所述第一文档图像及第二文档图像的SURF特征点,找出每两张配对SURF特征点的数量差值小于或等于第一预设阈值,即相似度小于或等于第一预设阈值的第一文档图像及第二文档图像归为同一组。
4.如权利要求3所述的文档图像页码迁移方法,其特征在于,所述SURF算法包括以下步骤:
构建Hessian矩阵,生成每张所述第一文档图像及第二文档图像中所有的兴趣点,以对图像中稳定的边缘点特征进行提取;
构建尺度空间,使用滤波器处理影像并利用高斯差侦测影像中尺度不变的特征点,所述尺度空间由N组L层组成,且各组间图像的尺寸一致;
对图像中的特征点进行定位,将经所述Hessian矩阵处理后的各像素点与二维图像空间和尺度空间邻域内的26个点进行比较,以初步定位出关键点,再经过滤除能量较弱的关键点以及错误定位的关键点,以筛选出最终的稳定特征点;
通过统计所述稳定特征点圆形邻域内的haar小波特征以对所述稳定特征点的主方向进行分配,在所述稳定特征点的圆形邻域内,统计60°扇形内所有点的水平、垂直haar小波特征总和,求和后,旋转扇形并对旋转后扇形区域内haar小波特征值进行统计,统计后再次旋转扇形并重新统计直至全部扇形内的haar小波特征值统计完成,统计完成后将haar小波特征总和值最大的扇形方向作为该稳定特征点的主方向;
生成特征点描述子,在特征点周围取一个4*4的矩形区域,且取得矩形区域的方向为沿所述稳定特征点的主方向,各子区域统计25个像素相对主方向的水平方向和垂直方向的haar小波特征;及
对所述稳定特征点进行匹配,通过计算两所述稳定特征点之间的欧式距离以确定两者之间的匹配度,取欧氏距离最小的两个所述稳定特征点作为一对匹配度最高的配对SURF特征点。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江西博微新技术有限公司,未经江西博微新技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910775308.6/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序