[发明专利]一种表格重建的方法及电子设备有效

专利信息
申请号: 202210523453.7 申请日: 2022-05-13
公开(公告)号: CN114943978B 公开(公告)日: 2023-10-03
发明(设计)人: 王伟印;张晓程 申请(专利权)人: 上海弘玑信息技术有限公司
主分类号: G06V30/412 分类号: G06V30/412;G06V30/414;G06V30/146;G06V30/10
代理公司: 北京超凡宏宇知识产权代理有限公司 11463 代理人: 钟扬飞
地址: 201240 上海市闵*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 表格 重建 方法 电子设备
【说明书】:

本申请属于数据处理技术领域,公开了一种表格重建的方法及电子设备,该方法包括,对待处理图像进行文本识别,获得待处理图像的文本区域识别结果,文本区域识别结果中包含文本区域的区域文本内容以及区域位置信息;根据区域位置信息,确定目标表格的各个表格行坐标以及各个表格列坐标;根据各个表格行坐标以及各个表格列坐标,生成空白表格;根据区域位置信息,将区域文本内容添加到空白表格中,获得目标表格。这样,可以重建待处理图像中的有框表格或无框表格,提高了表格重建的准确率和适用范围。

技术领域

本申请涉及数据处理技术领域,具体而言,涉及一种表格重建的方法及电子设备。

背景技术

随着信息化技术的发展,信息无纸化办公的普及,人们对数据处理的便捷性要求越来越高。在一些办公场景中,通常需要将表格图像进行表格识别以及表格重建,以获得重建后的表格。

现有技术下,通常是采用膨胀腐蚀等图像处理操作,确定表格图像中的线条,并根据各线条以及各线条的交点坐标,重建表格。

但是,若表格图像中的表格包含无边框的单元格或者边框不明显的单元格,则采用这种方式,重建的表格存在一定的偏差。

发明内容

本申请实施例的目的在于提供一种表格重建的方法及电子设备,用以在重建表格图像中的表格时,减少重建的表格的偏差。

一方面,提供一种表格重建的方法,包括:

对待处理图像进行文本识别,获得待处理图像的文本区域识别结果,文本区域识别结果中包含文本区域的区域文本内容以及区域位置信息;

根据区域位置信息,确定目标表格的各个表格行坐标以及各个表格列坐标;

根据各个表格行坐标以及各个表格列坐标,生成空白表格;

根据区域位置信息,将区域文本内容添加到空白表格中,获得目标表格。

在上述实现过程中,通过待处理图像中识别出的各文本区域的区域文本内容以及区域位置信息,重建表格,可以重建待处理图像中的有框表格,也可以重建待处理图像中的无框表格,提高了表格重建的准确率。

一种实施方式中,区域位置信息包括文本区域的区域顶点坐标,对待处理图像进行文本识别,获得待处理图像的文本区域识别结果,包括:对待处理图像进行文本检测,获得文本区域的多个区域顶点坐标,区域顶点坐标为文本区域的顶点的坐标;对文本区域进行文本识别,获得区域文本内容。

在上述实现过程中,对待处理图进行文本识别,确定文本区域中的各区域顶点坐标以及区域文本内容,从而可以准确识别出各文本区域的位置以及内容。

一种实施方式中,区域顶点坐标包括区域顶点横坐标和区域顶点纵坐标,根据区域位置信息,确定目标表格的各个表格行坐标以及各个表格列坐标,包括:确定各区域顶点纵坐标中的最大纵坐标和最小纵坐标;确定各区域顶点横坐标中的最大横坐标和最小横坐标;根据区域位置信息,确定各个纵坐标的第一区域数量和各个横坐标的第二区域数量,第一区域数量为包含某一纵坐标的文本区域的个数,第二区域数量为包含某一横坐标的文本区域的个数;根据最大纵坐标、最小纵坐标,以及第一区域数量,确定各个表格行坐标;根据最大横坐标、最小横坐标,以及第二区域数量,确定各个表格列坐标。

在上述实现过程中,通过各文本区域所在的位置,确定出各表格行坐标和表格列坐标,可以识别出无框表格的行和列,提高了表格重建的准确率。

一种实施方式中,根据最大纵坐标、最小纵坐标,以及第一区域数量,确定各个表格行坐标,包括:根据各个纵坐标及其对应的第一区域数量,确定波谷纵坐标,波谷纵坐标的第一区域数量不高于波谷纵坐标的相邻纵坐标的第一区域数量,波谷纵坐标的相邻纵坐标为波谷纵坐标的前一个纵坐标以及后一个纵坐标;根据最大纵坐标、最小纵坐标,以及波谷纵坐标,获得各个表格行坐标。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海弘玑信息技术有限公司,未经上海弘玑信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202210523453.7/2.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top