[发明专利]扭曲文档恢复方法、装置、设备及介质在审
申请号: | 202110461501.X | 申请日: | 2021-04-27 |
公开(公告)号: | CN113034406A | 公开(公告)日: | 2021-06-25 |
发明(设计)人: | 易苗;张蓉 | 申请(专利权)人: | 中国平安人寿保险股份有限公司 |
主分类号: | G06T5/00 | 分类号: | G06T5/00;G06T7/00;G06T3/40 |
代理公司: | 深圳市赛恩倍吉知识产权代理有限公司 44334 | 代理人: | 刘丽华;杨毅玲 |
地址: | 518000 广东省深圳市福田区益田路503*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 扭曲 文档 恢复 方法 装置 设备 介质 | ||
本发明涉及人工智能领域,提供一种扭曲文档恢复方法、装置、设备及介质,能够基于2D扰动网格生成扭曲样本,采用合成的方法生成训练数据,减少了人力收集数据的成本和难度,且生成的训练数据量可根据需要进行增减,解决了扭曲样本量及样本种类不足的问题,构建损失函数,采用掩膜图像进行模型的训练,使模型的训练关注于形变映射关系的学习,减小了背景、光照等其它因素的干扰,模型训练更易收敛,直接从对文本行的矫正出发,思路直观有效,且相比于利用整张图像,模型计算量小,更易部署,进而基于人工智能手段实现扭曲文本的自动恢复。此外,本发明还涉及区块链技术,扭曲文档恢复模型可存储于区块链节点中。
技术领域
本发明涉及人工智能技术领域,尤其涉及一种扭曲文档恢复方法、装置、设备及介质。
背景技术
随着移动设备的普及,随手拍照已成为一种对物理文档进行数字化的普遍方式,并可据此展开后续的自动化操作,如文字识别。但是,由于物理文档时常存在扭曲或者变形,且易受拍照角度的影响,使得文字识别难以达到理想效果。
针对上述问题,需要对扭曲的文档进行恢复,常见的方法如DocUnet、DewarpNet等,大多直接利用整张图片信息学习扭曲文档与平整化文档之间的映射关系,学习过程中易受到图像背景、光照等额外因素的干扰,进而对映射关系的学习造成不良影响,同时,整个过程计算量大,易受图片输入分辨率的影响。
发明内容
鉴于以上内容,有必要提供一种扭曲文档恢复方法、装置、设备及介质,能够基于人工智能手段实现扭曲文本的自动恢复。
一种扭曲文档恢复方法,所述方法包括:
根据扭曲文档恢复指令获取初始样本;
对所述初始样本进行文本检测,得到所述初始样本的文本行信息;
对所述文本行信息进行扰动处理,得到与所述初始样本对应的扭曲样本,并获取所述初始样本与对应的扭曲样本间的映射关系;
构建损失函数;
根据所述初始样本与对应的扭曲样本间的映射关系,以及所述损失函数训练预设网络;
当所述损失函数的取值不再减小时,停止训练,得到扭曲文档恢复模型;
接收待恢复文档图片,对所述待恢复文档图片进行文本检测,得到待恢复信息;
将所述待恢复信息输入至所述扭曲文档恢复模型,得到目标映射关系,并根据所述目标映射关系恢复所述待恢复文档图片。
根据本发明优选实施例,所述根据扭曲文档恢复指令获取初始样本包括:
解析所述扭曲文档恢复指令的方法体,得到所述扭曲文档恢复指令所携带的信息;
获取预设标签;
根据所述预设标签构建正则表达式;
根据所述正则表达式对所述扭曲文档恢复指令所携带的信息进行遍历,并将遍历到的数据确定为目标地址;
连接至所述目标地址,并获取所述目标地址存储的数据作为所述初始样本。
根据本发明优选实施例,所述对所述文本行信息进行扰动处理,得到与所述初始样本对应的扭曲样本包括:
在所述文本行信息上添加配置网格;
在所述配置网格上随机选择网格顶点作为初始变形点;
随机生成形变向量;
将所述初始变形点确定为起点,根据所述形变向量进行传播;
获取配置权重,根据所述配置权重计算所述配置网格中其他任意网格顶点变形后的坐标,得到网格图片;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国平安人寿保险股份有限公司,未经中国平安人寿保险股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110461501.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种学生教育安全装置
- 下一篇:Annoy热更新方法、装置、设备及介质