[发明专利]图像处理方法、装置、计算机设备及存储介质在审
申请号: | 202111007568.2 | 申请日: | 2021-08-30 |
公开(公告)号: | CN113723289A | 公开(公告)日: | 2021-11-30 |
发明(设计)人: | 李玖林;喻红 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04 |
代理公司: | 北京中强智尚知识产权代理有限公司 11448 | 代理人: | 黄耀威 |
地址: | 518000 广东省深圳市福田街*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 处理 方法 装置 计算机 设备 存储 介质 | ||
本申请涉及人工智能,提供一种图像处理方法、装置、计算机设备及存储介质,包括:获取包含变形文档的待恢复文档图像;提取所述待恢复文档图像的二维特征信息,并基于所述待恢复文档图像的二维特征信息生成所述待恢复文档图像的二维特征图像;基于所述二维特征图像生成所述待恢复文档图像的三维特征信息;根据所述待恢复文档图像的二维特征信息和三维特征信息确定目标变换关系,其中,所述目标变换关系包括所述待恢复文档图像与所述变形文档对应的未变形文档图像间的变换关系;根据所述目标变换关系,恢复所述待恢复文档图像。
技术领域
本发明实施例涉及人工智能技术,尤其是一种图像处理方法、装置、计算机设备及存储介质。
背景技术
纸质文件是最为重要的信息载体,记录着许多重要的信息。随着科技日益发达和相机像素的日益提高,通过手机拍照及图像识别,人们可以很方便快捷的将此类文件进行数字化,比如将文档图片转换成pdf,excel等格式,然后存储在计算机中。
若想要以高质量、高精度保存文档图像中的文档信息,则对拍摄的文档图像具有一定的要求。然而,由于拍摄时,文档可能存在物理变形、光线较强或较弱等因素,使得用手机拍摄得到文档图像存在不同程度的变形、卷曲,进而导致对文档图像中信息的识别精度较低。
发明内容
本发明实施例提供一种能够提高扭曲变形文档图像识别精度的图像处理方法、装置、计算机设备及存储介质。
为解决上述技术问题,本发明创造的实施例采用的一个技术方案是:提供一种图像处理方法,
包括:获取包含变形文档的待恢复文档图像;提取所述待恢复文档图像的二维特征信息,并基于所述待恢复文档图像的二维特征信息生成所述待恢复文档图像的二维特征图像;基于所述二维特征图像生成所述待恢复文档图像的三维特征信息;根据所述待恢复文档图像的二维特征信息和三维特征信息确定目标变换关系,其中,所述目标变换关系包括所述待恢复文档图像与所述变形文档对应的未变形文档图像间的变换关系;根据所述目标变换关系,恢复所述待恢复文档图像。
在一些方式中,所述根据所述待恢复文档图像的二维特征信息和三维特征信息确定目标变换关系,并根据所述目标变换关系,恢复所述待恢复文档图像之前,所述方法还包括:获取目标样本集,并构建第一损失函数,所述目标样本集中的每个训练样本均为包含变形文档的第一图像,一个第一图像对应一个包含未变形文档的第二图像;根据所述目标样本集以及所述第一损失函数训练第一预设网络;当所述第一损失函数的值不再减小时停止训练所述第一预设网络,得到第一模型;其中,所述第一损失函数用于表示所述第一预设网络对第三图像的预测结果与第四图像间的误差,所述第三图像为所述训练样本集中的任一第一图像,所述第四图像为与所述第三图像对应的第二图像。
在一些方式中,所述当所述第一损失函数的值不再减小时停止训练所述第一预设网络,得到第一模型之后,所述方法还包括:通过所述第一模型,将所述待恢复文档图像转换为二维特征图像;其中,所述二维特征图像为六十四通道图像,所述二维特征图像的特征信息包括以下至少一项:所述待恢复文档图像包含的文字信息,所述待恢复文档图像的纹理信息。
在一些方式中,所述通过所述第一模型,将所述待恢复文档图像转换为二维特征图像之后,所述方法还包括:提取所述第一模型输出的二维特征图像的第一特征向量;通过第二预设网络对所述第一特征向量执行下卷积操作,得到第二特征向量集合,所述第二特征向量集合包括所述下卷积操作过程中每层卷积得到的第二特征向量;通过所述第二预设网络对目标特征向量执行上卷积操作,得到第三特征向量集合;其中,所述目标特征向量为所述下卷积操作中最后一层卷积得到的第二特征向量;所述第三特征向量集合包括所述上卷积操作过程中每层卷积得到的第三特征向量;所述第三特征向量集合中包括与所述第二特征向量集合中任一第二特征向量存在映射关系的第三特征向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111007568.2/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序