[发明专利]一种形变表格结构识别方法在审

专利信息
申请号: 202210573606.9 申请日: 2022-05-24
公开(公告)号: CN114973283A 公开(公告)日: 2022-08-30
发明(设计)人: 钟婧婷;杨词慧;叶小丽 申请(专利权)人: 南昌航空大学
主分类号: G06V30/412 分类号: G06V30/412;G06V30/164;G06V30/18
代理公司: 南昌丰择知识产权代理事务所(普通合伙) 36137 代理人: 张荣
地址: 330000 江*** 国省代码: 江西;36
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 形变 表格 结构 识别 方法
【说明书】:

本发明公开了一种形变表格结构识别方法,其特征在于,该方法包括以下步骤:图像预处理、字符去除、角点定位、轮廓获取、单元格定位。本发明的优点在于:该方法对于形变表格存在的背景、光照、物理形变等干扰,提供一种形变表格结构识别方法。该方法能够有效去除图像中的字符,准确获取图像中的角点信息,同时定位单元格的位置。此方法能够有效适用于形变表格的结构识别,不仅抗干扰能力强、准确率高,还具有较好的应用前景。

技术领域

本发明属于计算机信息技术领域,具体涉及一种形变表格结构识别方法。

背景技术

表格结构识别是图像处理和文档识别领域中的重要研究内容。表格的样式、类型多种多样,使得表格图像的结构识别成为一大难题。如今成熟的表格结构识别方法大多针对PDF、HTML或扫描类表格图像,如名称为“一种基于图像识别的PDF表格结构识别方法”(公开号为CN111144300A)的专利文献和名称为“一种基于图注意力机制的PDF表格结构识别方法”(公开号为CN110751038A)的专利文献分别公开了针对PDF表格图像的结构识别方法。这些方法仅针对于PDF表格图像,适用范围较为局限。

也有专利提出了针对拍照类表格图像的结构识别方法,如名称为“一种表格结构提取方法”(公开号为CN111368695A)的专利文献公开了一种基于图像的表格结构提取方法,通过直线检测、查找角点、断线续连等步骤获取表格单元格。虽然该方法能够完整提取表格,但当图像的表格线弯曲时便不再适用。名称为“一种基于表格节点识别的表格结构补全算法”(公开号为CN109447007A)的专利文献公开了一种通过识别表格节点,尽可能还原表格本身结构化特征的方法。虽然该方法能够对有透视角度的图像进行矫正,但对于存在卷曲、褶皱的图像仍然很难获得较高的准确度。

发明内容

为解决上述技术问题,本发明提出一种形变表格结构识别方法,对存在背景、光照、物理形变等因素干扰的表格图像进行结构识别;通过图像预处理、字符去除、角点定位、轮廓获取、单元格定位等方法识别表格图像的结构。

本发明提出的一种形变表格结构识别方法,其特征在于,该方法包括以下步骤:

(1)图像预处理;对输入的含有表格的原始图像I进行图像增强、二值化及骨架提取,得到第一二值图像I1

(2)字符去除;采用字符去除算法将第一二值图像I1中存在的大部分字符去除,得到第二二值图像I2;然后进一步判断像素点四个邻接矩形区域中黑色像素点的个数,将第二二值图像I2中的所有字符去除,得到第三二值图像I3

(3)角点定位;首先采用角点检测算法对第三二值图像I3中的角点进行检测,得到第一角点集合P1;然后对第一角点集合P1中的角点进行聚类,得到第二角点集合P2;最后对第二角点集合P2中不符合条件的角点进行筛选,得到原始图像I的角点集合P3

(4)轮廓获取;将第三二值图像I3水平方向上宽度为1的像素删除,获取只保留水平线的第四二值图像I4;获取第四二值图像I4中所有的轮廓Con1,Con2,...,Conβ,其中β为第四二值图像I4中的轮廓总数;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南昌航空大学,未经南昌航空大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202210573606.9/2.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top