[发明专利]扭曲文档图像的矫正方法和装置有效

专利信息
申请号: 202010066508.7 申请日: 2020-01-20
公开(公告)号: CN111260586B 公开(公告)日: 2023-07-04
发明(设计)人: 谢群义;钦夏孟;李煜林;韩钧宇;朱胜贤 申请(专利权)人: 北京百度网讯科技有限公司
主分类号: G06T5/00 分类号: G06T5/00;G06N3/0464
代理公司: 北京同立钧成知识产权代理有限公司 11205 代理人: 张娜;刘芳
地址: 100085 北京市*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 扭曲 文档 图像 矫正 方法 装置
【说明书】:

发明实施例提供一种扭曲文档图像的矫正方法和装置,其中,扭曲文档图像的矫正方法包括:获取扭曲文档图像;将扭曲文档图像输入到矫正模型中,得到扭曲文档图像对应的矫正后的图像;其中,矫正模型是以图像样本集合为输入,以图像样本集合中每个图像样本对应的矫正后的图像为输出训练得到的模型,图像样本存在扭曲。通过将待矫正的扭曲文档图像输入到矫正模型中,通过矫正模型可以获取扭曲文档图像对应的矫正后的图像,端到端的实现了文档图像矫正,提高了文档图像矫正的准确率,扩展了文档图像矫正的应用场景。

技术领域

本发明实施例涉及大数据处理技术领域,尤其涉及一种扭曲文档图像的矫正方法和装置。

背景技术

文档图像矫正是将图像中褶皱或卷曲的文档恢复成平整状态的过程,可以简称为文档矫正。

文档矫正通常可以采用两种方法:全局形变参数预测和逐像素形变参数预测。前者只能预测得到一组唯一的形变参数,无法适用于像素点形变不一致的场景。后者可以针对所有像素点预测形变参数,但是,形变参数预测和图像恢复是两个独立的步骤。由于形变参数是稠密的,而且,图像恢复采用形变逆运算,根据形变参数的类型不同采用不同的方法,导致在图像恢复过程中产生大量的计算,文档图像矫正步骤繁琐,误差高,矫正效果差。

发明内容

本发明实施例提供一种扭曲文档图像的矫正方法和装置,提高了文档图像矫正的准确率,扩展了文档图像矫正的应用场景。

第一方面,本发明实施例提供一种扭曲文档图像的矫正方法,包括:

获取扭曲文档图像;

将所述扭曲文档图像输入到矫正模型中,得到所述扭曲文档图像对应的矫正后的图像;其中,所述矫正模型是以图像样本集合为输入,以所述图像样本集合中每个图像样本对应的矫正后的图像为输出训练得到的模型,所述图像样本存在扭曲。

可选的,所述矫正模型包括串联连接的形变参数预测模块和形变矫正模块;其中,所述形变参数预测模块是以所述图像样本集合为输入,以所述图像样本集合包括的每个图像样本中每个像素的形变参数为输出训练得到的U型卷积神经网络模型,所述形变矫正模块是以所述图像样本集合和所述形变参数预测模块的输出结果为输入,以所述图像样本集合中每个图像样本对应的矫正后的图像为输出训练得到的模型;

所述将所述扭曲文档图像输入到矫正模型中,得到所述扭曲文档图像对应的矫正后的图像,包括:

将所述扭曲文档图像输入到所述矫正模型中,通过所述形变参数预测模块输出中间结果,并根据所述中间结果通过所述形变矫正模块得到所述扭曲文档图像对应的矫正后的图像;所述中间结果包括所述扭曲文档图像中每个像素的形变参数。

可选的,所述形变参数预测模块包括至少两级串联连接的形变参数预测子模块;其中,第一级形变参数预测子模块是以所述图像样本集合为输入,以所述图像样本集合包括的每个图像样本中每个像素的形变参数为输出训练得到的U型卷积神经网络模型,第二级形变参数预测子模块是以所述图像样本集合和所述第一级形变参数预测子模块的输出结果为输入,以所述图像样本集合包括的每个图像样本中每个像素的形变参数为输出训练得到的U型卷积神经网络模型,以此类推;

所述中间结果为所述至少两级形变参数预测子模块中最后一级形变参数预测子模块的输出结果。

可选的,所述根据所述中间结果通过所述形变矫正模块得到所述扭曲文档图像对应的矫正后的图像,包括:

获取运行参数,所述运行参数指示并行进行矫正操作的像素的个数;

根据所述运行参数在所述扭曲文档图像中获取多个像素;

根据所述多个像素分别对应的形变参数通过所述形变矫正模块并行对所述多个像素进行矫正,得到矫正后的多个像素。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010066508.7/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top