[发明专利]一种表格重建方法及装置在审
申请号: | 202111089109.3 | 申请日: | 2021-09-16 |
公开(公告)号: | CN113887181A | 公开(公告)日: | 2022-01-04 |
发明(设计)人: | 李磊;王凡;李军 | 申请(专利权)人: | 华清科盛(北京)信息技术有限公司 |
主分类号: | G06F40/177 | 分类号: | G06F40/177 |
代理公司: | 北京安瑞克专利代理事务所(特殊普通合伙) 11902 | 代理人: | 郭红梅 |
地址: | 100176 北京市大兴区北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 表格 重建 方法 装置 | ||
本说明书实施例提供了一种表格重建方法及装置。本发明在复杂的应用场景下,例如被遮挡、局部印刷不清等情况下,通过分割神经网络(例如unet分割网络)分割出的横线与竖线基础上,对未分割出的线段进行判断补充,完成表格的重建。
技术领域
本说明书实施例涉及计算机技术领域,尤其涉及一种表格重建方法及装置。
背景技术
原有的表格重建方法采用分割神经网络,通过对大量表格的学习,得到表格中的横线和竖线坐标,再根据坐标画出来,从而实现表格的重建。这种表格重建方法对于普通环境下有着很好的效果,但是对于复杂场景下模型的分割效果不是很好的,例如褶皱,局部遮挡,局部印刷不清等,是无法分割出完整线段的。因为局部表格图像特征被损坏,或者局部表格图像特征不存在,模型提取不到特征,导致无法分割,表格重建的还原效果较差。
发明内容
本说明书实施例提供及一种表格重建方法及装置,以解决现有技术的技术问题。
第一方面,本说明书实施例提供一种表格重建方法,包括:
步骤1,对表格图像进行灰度化处理;
步骤2,将灰度图像作为unet分割网络的输入,unet分割网络通过下采样提取图像特征,通过上采样还原表格线,从而得到横线坐标集合与竖线坐标集合;
步骤3,在步骤2得到的横线坐标集合中,按照预定顺序选择两条横线;
步骤4,对当前两条横线进行判断,若一条横线的左端点与右端点到另一条横线的距离均小于第一预设值,执行步骤9,否则执行步骤5;
步骤5,判断所述横线坐标集合中任意两条横线是否均完成判断,若是,执行步骤11,否则,返回步骤2;
步骤6,在步骤2得到的竖线坐标集合中,按照预定顺序选择两条竖线;
步骤7,对当前两条竖线进行判断,若一条竖线的上端点与下端点到另一条竖线的距离均小于第二预设值,执行步骤10,否则执行步骤8;
步骤8,判断所述竖线坐标集合中任意两条竖线是否均完成判断,若是,执行步骤11,否则,返回步骤2;
步骤9,将当前两条横线中一条横线的左端点与另一条横线的右端点连接,形成新的横线,利用新的横线坐标替换横线坐标集合中的当前两条横线坐标,返回步骤3;
步骤10,将当前两条中一条竖线的下端点与另一条竖线的上端点连接,形成新的竖线,利用新的竖线坐标替换竖线坐标集合中的当前两条竖线坐标,返回步骤6;
步骤11,得到新的横线坐标集合与竖线坐标集合;
步骤12,根据步骤11得到的横线坐标集合和竖线坐标集合,画出所有的横线与竖线,得到重建后的表格。
第二方面,本说明书实施例提供一种表格重建装置,包括存储器和处理器;
存储器用于存储计算机程序;
处理器用于执行该计算机程序实现第一方面的方法。
本说明书实施例有益效果如下:
本发明在复杂的应用场景下,例如被遮挡、局部印刷不清等情况下,通过分割神经网络(例如unet分割网络)分割出的横线与竖线基础上,对未分割出的线段进行判断补充,完成表格的重建。
附图说明
图1为本说明书实施例第一方面的方法流程图。
图2a为未补充修复的表格重建结果。
图2b为采用本发明方法补充修复后的表格重建结果。
具体实施方式
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华清科盛(北京)信息技术有限公司,未经华清科盛(北京)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111089109.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种表单分类方法及装置
- 下一篇:一种多工况汽车结构件参数化方法