[发明专利]扭曲文档图像的矫正方法和装置有效
申请号: | 202010066508.7 | 申请日: | 2020-01-20 |
公开(公告)号: | CN111260586B | 公开(公告)日: | 2023-07-04 |
发明(设计)人: | 谢群义;钦夏孟;李煜林;韩钧宇;朱胜贤 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06T5/00 | 分类号: | G06T5/00;G06N3/0464 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 张娜;刘芳 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 扭曲 文档 图像 矫正 方法 装置 | ||
本发明实施例提供一种扭曲文档图像的矫正方法和装置,其中,扭曲文档图像的矫正方法包括:获取扭曲文档图像;将扭曲文档图像输入到矫正模型中,得到扭曲文档图像对应的矫正后的图像;其中,矫正模型是以图像样本集合为输入,以图像样本集合中每个图像样本对应的矫正后的图像为输出训练得到的模型,图像样本存在扭曲。通过将待矫正的扭曲文档图像输入到矫正模型中,通过矫正模型可以获取扭曲文档图像对应的矫正后的图像,端到端的实现了文档图像矫正,提高了文档图像矫正的准确率,扩展了文档图像矫正的应用场景。
技术领域
本发明实施例涉及大数据处理技术领域,尤其涉及一种扭曲文档图像的矫正方法和装置。
背景技术
文档图像矫正是将图像中褶皱或卷曲的文档恢复成平整状态的过程,可以简称为文档矫正。
文档矫正通常可以采用两种方法:全局形变参数预测和逐像素形变参数预测。前者只能预测得到一组唯一的形变参数,无法适用于像素点形变不一致的场景。后者可以针对所有像素点预测形变参数,但是,形变参数预测和图像恢复是两个独立的步骤。由于形变参数是稠密的,而且,图像恢复采用形变逆运算,根据形变参数的类型不同采用不同的方法,导致在图像恢复过程中产生大量的计算,文档图像矫正步骤繁琐,误差高,矫正效果差。
发明内容
本发明实施例提供一种扭曲文档图像的矫正方法和装置,提高了文档图像矫正的准确率,扩展了文档图像矫正的应用场景。
第一方面,本发明实施例提供一种扭曲文档图像的矫正方法,包括:
获取扭曲文档图像;
将所述扭曲文档图像输入到矫正模型中,得到所述扭曲文档图像对应的矫正后的图像;其中,所述矫正模型是以图像样本集合为输入,以所述图像样本集合中每个图像样本对应的矫正后的图像为输出训练得到的模型,所述图像样本存在扭曲。
可选的,所述矫正模型包括串联连接的形变参数预测模块和形变矫正模块;其中,所述形变参数预测模块是以所述图像样本集合为输入,以所述图像样本集合包括的每个图像样本中每个像素的形变参数为输出训练得到的U型卷积神经网络模型,所述形变矫正模块是以所述图像样本集合和所述形变参数预测模块的输出结果为输入,以所述图像样本集合中每个图像样本对应的矫正后的图像为输出训练得到的模型;
所述将所述扭曲文档图像输入到矫正模型中,得到所述扭曲文档图像对应的矫正后的图像,包括:
将所述扭曲文档图像输入到所述矫正模型中,通过所述形变参数预测模块输出中间结果,并根据所述中间结果通过所述形变矫正模块得到所述扭曲文档图像对应的矫正后的图像;所述中间结果包括所述扭曲文档图像中每个像素的形变参数。
可选的,所述形变参数预测模块包括至少两级串联连接的形变参数预测子模块;其中,第一级形变参数预测子模块是以所述图像样本集合为输入,以所述图像样本集合包括的每个图像样本中每个像素的形变参数为输出训练得到的U型卷积神经网络模型,第二级形变参数预测子模块是以所述图像样本集合和所述第一级形变参数预测子模块的输出结果为输入,以所述图像样本集合包括的每个图像样本中每个像素的形变参数为输出训练得到的U型卷积神经网络模型,以此类推;
所述中间结果为所述至少两级形变参数预测子模块中最后一级形变参数预测子模块的输出结果。
可选的,所述根据所述中间结果通过所述形变矫正模块得到所述扭曲文档图像对应的矫正后的图像,包括:
获取运行参数,所述运行参数指示并行进行矫正操作的像素的个数;
根据所述运行参数在所述扭曲文档图像中获取多个像素;
根据所述多个像素分别对应的形变参数通过所述形变矫正模块并行对所述多个像素进行矫正,得到矫正后的多个像素。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010066508.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:煎药熏蒸装置及理疗设备
- 下一篇:一种基于自适应的冷库温度模糊控制方法
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序