[发明专利]一种表格识别套打方法、计算机设备及计算机可读存储介质在审
申请号: | 202011010032.1 | 申请日: | 2020-09-23 |
公开(公告)号: | CN112183038A | 公开(公告)日: | 2021-01-05 |
发明(设计)人: | 张志;李建军;黄涛;詹皇源;杜启亮;杨湖广 | 申请(专利权)人: | 国信智能系统(广东)有限公司 |
主分类号: | G06F40/177 | 分类号: | G06F40/177;G06T7/13;G06T7/64;G06T7/181;G06T5/00;G06T7/136;G06T5/30;G06T7/90 |
代理公司: | 广州博士科创知识产权代理有限公司 44663 | 代理人: | 宋佳 |
地址: | 528200 广东省佛山市南海*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 表格 识别 方法 计算机 设备 可读 存储 介质 | ||
1.一种表格识别套打方法,其特征在于,包括:
获取待识别的表格图像,并对采集到的表格图像进行预处理,得到预处理后的第一目标图像;
对预处理后的第一目标图像进行校正处理以获得第二目标图像;
提取第二目标图像的表格轮廓并进行细化处理获得第三目标图像;
根据第三目标图像分析表格横纵结构,以获得表格行列结构信息;
通过角点检测识别第三目标图像的角点位置,并结合表格行列结构信息,确定表格中单元格位置信息;
输出表格中单元格位置信息,以绘制表格实现表格套打。
2.根据权利要求1所述的一种表格识别套打方法,其特征在于,对预处理后的第一目标图像进行校正处理以获得第二目标图像之前,还包括检测第一目标图像的表格图像是否采集完整,具体如下:
检测第一目标的表格图像的外轮廓边界是否接触到图像的边缘;
检测第一目标的表格图像的外轮廓的轮廓端点数是否等于4个;
若判定表格外轮廓接触到图像边界或表格外轮廓端点数不是4个,则判断为表格拍摄不完整,返回重拍。
3.根据权利要求1所述的一种表格识别套打方法,其特征在于,对预处理后的第一目标图像进行校正处理以获得第二目标图像,步骤包括:识别第一目标图像所有边框,进行凸包拟合,筛选出最大的边框为A4纸的边框,得到A4纸的顶点坐标信息,通过透视变换矩阵进行透视变换校正,以获得第二目标图像;其中,识别第一目标图像所有边框的步骤包括:寻找第一目标图像中的物体轮廓,再查找出图像中物体的凸包,将检测出来的轮廓连续光滑的曲线折线化,并对图像轮廓点进行多边形拟合,筛选出所有的四边形边框。
4.根据权利要求3所述的一种表格识别套打方法,其特征在于,通过透视变换矩阵进行透视变换校正,包括:变换公式为
其中,u、v是原始图片坐标,通过该变换公式,可以得到变换后对应的图片坐标变换矩阵可拆分为几部分:表示线性变换,包含缩放、旋转、错切等;[a31 a32]代表平移;[a13 a23]T产生透视变换;可得
从而将定位得到的A4纸的四个顶点坐标、结合原始坐标代入变换公式中,以实现透视校正。
5.根据权利要求1所述的一种表格识别套打方法,其特征在于,对采集到的表格图像进行预处理,步骤包括:
灰度化处理,将采集到的表格图像转变为单通道的灰度图像;
二值化处理,对灰度化处理后的灰度图像使用局部自适应阈值法以动态形式确定二值化阈值,实现表格图像的二值化处理;
高斯滤波处理,使用图像滤波减小图片噪声的干扰,使用高斯滤波降噪,使用掩膜扫描图像,利用掩膜中心像素领域的像素加权平均代替掩膜中心像素的像素值,遍历整张表格图像实现高斯滤波处理;
边缘检测处理,使用边缘检测算法获得完整的边缘信息、一定程度凸显有效区域,使用Canny边缘检测算法,该算法遵循最优边缘准则,使用双阈值筛选、非极大值抑制使算法准确识别表格图像边缘;
膨胀处理,使用膨胀操作对表格图像求局部最大值,使目标边界与背景合并,使边界向外扩,增强表格图像质量,填补边界区域中存在的一些孔洞,消除噪声干扰,得到完整的表格线,使边界线闭合变粗。
6.根据权利要求1所述的一种表格识别套打方法,其特征在于,提取第二目标图像的表格轮廓并进行细化处理获得第三目标图像,包括:
使用开操作方法去除第二目标图像中表格图像的文字部分及细小横纵线等冗余信息;使用该开操作方法包括先对表格图像进行腐蚀操作,再对表格图像进行膨胀操作,以消除表格图像中的小毛刺和突出物,使表格图像中轮廓光滑,去除文字部分及细小横纵线等冗余信息;
识别提取表格图像的水平框线、垂直框线及两者的交点,并合并形成表格轮廓图;
将所述表格轮廓图根据细化规则操作获得表格骨架,以形成第三目标图像;其中,所述细化规则操作包括:通过选取定义一个像素点P,检测识别该像素点P的八领域点信息,判断该像素点P是否被删除。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国信智能系统(广东)有限公司,未经国信智能系统(广东)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011010032.1/1.html,转载请声明来源钻瓜专利网。