[发明专利]一种全线表表格结构识别方法有效
申请号: | 202210425844.5 | 申请日: | 2022-04-22 |
公开(公告)号: | CN114529925B | 公开(公告)日: | 2022-07-15 |
发明(设计)人: | 黄双萍;彭政华;杨帆 | 申请(专利权)人: | 华南理工大学;人工智能与数字经济广东省实验室(广州) |
主分类号: | G06V30/412 | 分类号: | G06V30/412;G06V10/24;G06V10/26;G06V10/28;G06V10/44;G06V10/764;G06K9/62 |
代理公司: | 东莞卓诚专利代理事务所(普通合伙) 44754 | 代理人: | 朱鹏 |
地址: | 510000 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 全线 表表 结构 识别 方法 | ||
1.一种全线表表格结构识别方法,其特征在于,包括以下步骤:
步骤1,采用实例分割算法对文档图像I进行单元格分割,得到每一个单元格对应于文档图像中单元格所在区域的二值化掩码图像;
步骤2,将每一个单元格的二值化掩码图像进行或运算和形态学闭操作,裁剪出表格整体区域,得到表格整体区域图像I’及表格整体区域图像的二值化掩码图像;
步骤3,采用矫正算法,在获得表格整体区域图像I’中表格区域的四个顶点后,利用TPS变换以这四个顶点为基准将弯曲表格修正为以这四个顶点为顶点的近似四边形表格区域,并使用透视变换将近似四边形表格区域转换成水平矩形的正表格图像T;
步骤4,对正表格图像T进行单元格目标检测,获得每一个单元格的边界框;
步骤5,利用基于规则化排序算法进行排序以识别表格结构,将表格结构表达成对应的标记语言描述;
步骤5中,所述的基于规则化排序算法分别利用单元格边界框的左上角顶点和右下角顶点来代表单元格进行依行列排序和依列行排序,以获得每个单元格中的逻辑位置,求取每个单元格跨行跨列属性,以此识别表格结构;
所述的依行列排序是指:每次以一行的单元格为排序对象,先完成第一行的单元格从左到右的空间位置列排序,再完成第二行的单元格从左到右的空间位置列排序,直到最后一行,即从上至下依行进行每一行中单元格的列排序获取单元格在所在行中的列号,又因为是逐行进行的排序,第一次排序的一整行内的单元格的行号即为1,第二次排序的一整行内的单元格的行号即为2,以此类推,获得单元格在表格中代表逻辑位置的行列号;
所述的依列行排序是指:每次以一列的单元格为排序对象,先完成第一列的单元格从上到下的空间位置行排序,再完成第二列的单元格从上到下的空间位置行排序,直到最后一列,即从左至右依列进行每一列中单元格的行排序获取单元格在所在列中的行号,又因为是逐列进行的排序,第一次排序的一整列内的单元格的列号即为1,第二次排序的一整列内的单元格的列号即为2,以此类推,获得单元格在表格中代表逻辑位置的行列号。
2.根据权利要求1所述的一种全线表表格结构识别方法,其特征在于,步骤2包括以下步骤:
步骤201,将每个单元格对应于文档图像所在区域的二值化掩码图像集合之间进行或运算;
步骤202,进行形态学闭操作去掉或运算结果中的空隙部分;
步骤203,使用最小外接水平矩形裁剪出表格区域图像,即得到精准的表格整体区域图像I’及表格整体区域图像的二值化掩码图像。
3.根据权利要求1所述的一种全线表表格结构识别方法,其特征在于,步骤3包括以下步骤:
步骤301,采用OpenCV中的轮廓求取算法,求得表格整体区域图像I’的二值化掩码图像中的表格掩码轮廓,然后获取表格掩码轮廓的最小外接矩形,从而获取表格的倾斜角度,在得到的倾斜角度的基础上,分别构造倾斜角度加上45°的两条直线与加上135°的两条直线共四条直线,分别位于表格掩码轮廓四个对角方向之外,将表格掩码轮廓中距离四条直线最近的点作为表格轮廓的四个顶点;
步骤302,分别在左上、右上顶点连线间以及左下、右下顶点连线间等距离取点,作为TPS变换目标点,两两连接目标点,得到等距垂直直线系,直线系与表格轮廓的交点作为初始点且与目标点两两匹配,然后进行TPS变换,使初始点尽可能拉近目标点,得到以轮廓的四个顶点为顶点的去弯曲后的近似四边形表格图像;
步骤303,将去弯曲后的近似四边形表格图像中表格的四个顶点在图像中的坐标与图像边界的四个顶点坐标相结合计算透视变换矩阵参数,对去弯曲后的近似四边形表格图像进行透视变换,得到平铺满图片的正表格图像T;
透视变换操作如下:
式中的和分别为变换前后的像素坐标,变换参数矩阵中的元素由透视变换前后表格四个顶点的坐标联立方程解得,为假设处于平面内的原图上的点乘以变换参数矩阵进行三维映射至三维空间后的坐标。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学;人工智能与数字经济广东省实验室(广州),未经华南理工大学;人工智能与数字经济广东省实验室(广州)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210425844.5/1.html,转载请声明来源钻瓜专利网。