[发明专利]用于表格识别的方法、电子设备和存储介质有效
申请号: | 202110542903.2 | 申请日: | 2021-05-19 |
公开(公告)号: | CN112990165B | 公开(公告)日: | 2021-08-06 |
发明(设计)人: | 张世坤;李超;李景阳 | 申请(专利权)人: | 北京欧应信息技术有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06N3/08 |
代理公司: | 北京市金杜律师事务所 11256 | 代理人: | 酆迅 |
地址: | 100020 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 表格 识别 方法 电子设备 存储 介质 | ||
1.一种用于表格识别的方法,包括:
获取包括表格的样本图像和与所述样本图像相关联的标注数据,所述标注数据指示多个表格线类型和与所述多个表格线类型相对应的多个表格线坐标;
将所述多个表格线坐标扩展为多个矩形坐标;
基于预定缩放率,对所述多个矩形坐标限定的多个矩形区域进行缩小,以生成与所述多个表格线类型相对应的多个二值图,所述多个二值图中的每个二值图指示与所对应表格线类型相对应的表格线的经缩小的矩形区域;
基于所述预定缩放率,对所述多个矩形坐标限定的多个矩形区域进行放大,以生成与所述多个表格线类型相对应的多个渐变图,所述多个渐变图中的每个渐变图指示与所对应表格线类型相对应的表格线和所述表格线的经放大的矩形区域中的对应矩形边之间的渐变值;
基于所述样本图像、所述多个二值图和所述多个渐变图,训练神经网络模型,以生成经训练的神经网络模型;
获取包括表格的目标图像;
基于所述目标图像,经由经训练的所述神经网络模型,生成与多个表格线类型相对应的多个预测二值图和多个预测渐变图,所述多个预测二值图中的每个预测二值图指示与所对应表格线类型相对应的表格线的第一预测矩形区域,所述多个预测渐变图中的每个预测渐变图指示与所对应表格线类型相对应的表格线和所述表格线的第二预测矩形区域中的对应矩形边之间的渐变值;
基于所述多个预测二值图和所述多个预测渐变图,确定与所述多个表格线类型相对应的多个预测表格线二值图;以及
基于所述多个预测表格线二值图,经由连通域算法,确定所述目标图像中所述表格的单元格坐标;
其中确定与所述多个表格线类型相对应的多个预测表格线二值图包括:
对于所述多个预测二值图和多个所述预测渐变图中与相同表格线类型相对应的预测二值图和预测渐变图:
生成所述预测二值图与所述预测渐变图之间的差值图;
基于所述差值图,经由可微分二值化,确定极大值区域和极小值区域;
确定所述极大值区域和所述极小值区域的并集所包围的区域,作为预测表格线区域;以及
对所述预测表格线区域进行二值化,以生成与所述表格线类型相对应的预测表格线二值图。
2.根据权利要求1所述的方法,其中所述渐变图在与所对应表格线类型相对应的表格线处指示第一预定值,在所述表格线的经放大的矩形区域中的对应矩形边处指示第二预定值,在从所述表格线到所述对应矩形边之间的区域指示从所述第一预定值到所述第二预定值之间的渐变值,所述第二预定值大于所述第一预定值。
3.根据权利要求2所述的方法,其中所述渐变图还在所述表格线相对于所述对应矩形边的镜像处指示所述第一预定值,以及在从所述镜像到所述对应矩形边之间的区域指示从所述第一预定值到所述第二预定值之间的渐变值。
4.根据权利要求1所述的方法,其中所述对应矩形边包括与所述表格线平行的两条矩形边。
5.根据权利要求1所述的方法,其中确定所述目标图像中所述表格的单元格坐标包括:
基于所述多个预测表格线二值图,经由连通域算法,确定多个水平线区域和多个垂直线区域;
分别基于所述多个水平线区域和所述多个垂直线区域,确定多条水平线和多条垂直线;
确定所述多条水平线和所述多条垂直线的多个交点坐标;以及
基于所述多个交点坐标,确定所述目标图像中所述表格的单元格坐标。
6.根据权利要求1所述的方法,其中所述多个表格线类型包括水平且可见、垂直且可见、水平且不可见以及垂直且不可见。
7.一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-6中任一项所述的方法。
8.一种存储有计算机指令的非瞬时计算机可读存储介质,其特征在于,所述计算机指令用于使所述计算机执行权利要求1-6中任一项所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京欧应信息技术有限公司,未经北京欧应信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110542903.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种冷数据的存储方法和系统
- 下一篇:一种故障根因检测方法及装置