[发明专利]一种形变表格结构识别方法在审
申请号: | 202210573606.9 | 申请日: | 2022-05-24 |
公开(公告)号: | CN114973283A | 公开(公告)日: | 2022-08-30 |
发明(设计)人: | 钟婧婷;杨词慧;叶小丽 | 申请(专利权)人: | 南昌航空大学 |
主分类号: | G06V30/412 | 分类号: | G06V30/412;G06V30/164;G06V30/18 |
代理公司: | 南昌丰择知识产权代理事务所(普通合伙) 36137 | 代理人: | 张荣 |
地址: | 330000 江*** | 国省代码: | 江西;36 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 形变 表格 结构 识别 方法 | ||
本发明公开了一种形变表格结构识别方法,其特征在于,该方法包括以下步骤:图像预处理、字符去除、角点定位、轮廓获取、单元格定位。本发明的优点在于:该方法对于形变表格存在的背景、光照、物理形变等干扰,提供一种形变表格结构识别方法。该方法能够有效去除图像中的字符,准确获取图像中的角点信息,同时定位单元格的位置。此方法能够有效适用于形变表格的结构识别,不仅抗干扰能力强、准确率高,还具有较好的应用前景。
技术领域
本发明属于计算机信息技术领域,具体涉及一种形变表格结构识别方法。
背景技术
表格结构识别是图像处理和文档识别领域中的重要研究内容。表格的样式、类型多种多样,使得表格图像的结构识别成为一大难题。如今成熟的表格结构识别方法大多针对PDF、HTML或扫描类表格图像,如名称为“一种基于图像识别的PDF表格结构识别方法”(公开号为CN111144300A)的专利文献和名称为“一种基于图注意力机制的PDF表格结构识别方法”(公开号为CN110751038A)的专利文献分别公开了针对PDF表格图像的结构识别方法。这些方法仅针对于PDF表格图像,适用范围较为局限。
也有专利提出了针对拍照类表格图像的结构识别方法,如名称为“一种表格结构提取方法”(公开号为CN111368695A)的专利文献公开了一种基于图像的表格结构提取方法,通过直线检测、查找角点、断线续连等步骤获取表格单元格。虽然该方法能够完整提取表格,但当图像的表格线弯曲时便不再适用。名称为“一种基于表格节点识别的表格结构补全算法”(公开号为CN109447007A)的专利文献公开了一种通过识别表格节点,尽可能还原表格本身结构化特征的方法。虽然该方法能够对有透视角度的图像进行矫正,但对于存在卷曲、褶皱的图像仍然很难获得较高的准确度。
发明内容
为解决上述技术问题,本发明提出一种形变表格结构识别方法,对存在背景、光照、物理形变等因素干扰的表格图像进行结构识别;通过图像预处理、字符去除、角点定位、轮廓获取、单元格定位等方法识别表格图像的结构。
本发明提出的一种形变表格结构识别方法,其特征在于,该方法包括以下步骤:
(1)图像预处理;对输入的含有表格的原始图像I进行图像增强、二值化及骨架提取,得到第一二值图像I1;
(2)字符去除;采用字符去除算法将第一二值图像I1中存在的大部分字符去除,得到第二二值图像I2;然后进一步判断像素点四个邻接矩形区域中黑色像素点的个数,将第二二值图像I2中的所有字符去除,得到第三二值图像I3;
(3)角点定位;首先采用角点检测算法对第三二值图像I3中的角点进行检测,得到第一角点集合P1;然后对第一角点集合P1中的角点进行聚类,得到第二角点集合P2;最后对第二角点集合P2中不符合条件的角点进行筛选,得到原始图像I的角点集合P3;
(4)轮廓获取;将第三二值图像I3水平方向上宽度为1的像素删除,获取只保留水平线的第四二值图像I4;获取第四二值图像I4中所有的轮廓Con1,Con2,...,Conβ,其中β为第四二值图像I4中的轮廓总数;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南昌航空大学,未经南昌航空大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210573606.9/2.html,转载请声明来源钻瓜专利网。