[发明专利]一种形变表格结构识别方法在审
申请号: | 202210573606.9 | 申请日: | 2022-05-24 |
公开(公告)号: | CN114973283A | 公开(公告)日: | 2022-08-30 |
发明(设计)人: | 钟婧婷;杨词慧;叶小丽 | 申请(专利权)人: | 南昌航空大学 |
主分类号: | G06V30/412 | 分类号: | G06V30/412;G06V30/164;G06V30/18 |
代理公司: | 南昌丰择知识产权代理事务所(普通合伙) 36137 | 代理人: | 张荣 |
地址: | 330000 江*** | 国省代码: | 江西;36 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 形变 表格 结构 识别 方法 | ||
1.一种形变表格结构识别方法,其特征在于,该方法包括以下步骤:
(1)图像预处理;对输入的含有表格的原始图像I进行图像增强、二值化及骨架提取,得到第一二值图像I1;
(2)字符去除;采用字符去除算法将第一二值图像I1中存在的大部分字符去除,得到第二二值图像I2;然后进一步判断像素点四个邻接矩形区域中黑色像素点的个数,将第二二值图像I2中的所有字符去除,得到第三二值图像I3;
(3)角点定位;首先采用角点检测算法对第三二值图像I3中的角点进行检测,得到第一角点集合P1;然后对第一角点集合P1中的角点进行聚类,得到第二角点集合P2;最后对第二角点集合P2中不符合条件的角点进行筛选,得到原始图像I的角点集合P3;
(4)轮廓获取;将第三二值图像I3水平方向上宽度为1的像素删除,获取只保留水平线的第四二值图像I4;获取第四二值图像I4中所有的轮廓Con1,Con2,...,Conβ,其中β为第四二值图像I4中的轮廓总数;
(5)单元格定位;对角点集合P3中的所有角点进行分类,将角点集合P3中属于轮廓的角点加入到点集其中得到角点集合然后根据角点集合point1,point2,...,pointβ中的每一个角点的位置,确定原始图像I中每一个单元格的左上角顶点、右上角顶点、右下角顶点、左下角顶点的坐标,得到单元格坐标集合CP。
2.根据权利要求1所述的一种形变表格结构识别方法,其特征在于:上述步骤(1)中对输入的含有表格的原始图像I进行图像增强、二值化及骨架提取,具体采用了以下方法:
(1.1)对输入的原始图像I采用图像增强算法进行图像增强,得到图像增强结果图像I01,然后采用图像二值化算法对图像增强结果图像I01进行图像二值化,得到图像增强结果二值图像I02;
(1.2)采用骨架提取算法对图像增强结果二值图像I02进行骨架提取,得到第一二值图像I1。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南昌航空大学,未经南昌航空大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210573606.9/1.html,转载请声明来源钻瓜专利网。