[发明专利]一种表格识别套打方法、计算机设备及计算机可读存储介质在审
申请号: | 202011010032.1 | 申请日: | 2020-09-23 |
公开(公告)号: | CN112183038A | 公开(公告)日: | 2021-01-05 |
发明(设计)人: | 张志;李建军;黄涛;詹皇源;杜启亮;杨湖广 | 申请(专利权)人: | 国信智能系统(广东)有限公司 |
主分类号: | G06F40/177 | 分类号: | G06F40/177;G06T7/13;G06T7/64;G06T7/181;G06T5/00;G06T7/136;G06T5/30;G06T7/90 |
代理公司: | 广州博士科创知识产权代理有限公司 44663 | 代理人: | 宋佳 |
地址: | 528200 广东省佛山市南海*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 表格 识别 方法 计算机 设备 可读 存储 介质 | ||
本发明涉及一种表格识别套打方法、计算机设备及计算机可读存储介质,包括步骤:获取待识别的表格图像,并对采集到的表格图像进行预处理,得到预处理后的第一目标图像;对预处理后的第一目标图像进行校正处理以获得第二目标图像;提取第二目标图像的表格轮廓并进行细化处理获得第三目标图像;根据第三目标图像分析表格横纵结构,获得表格行列结构信息;通过角点检测识别第三目标图像的角点位置,结合表格行列结构信息,确定表格中单元格位置信息;输出表格中单元格位置信息;其能够实现了对表格的识别,并进行套打且剔除表格中的数据信息,实现利用计算机自动对表格进行套打来提高人们的办公效率,达到只需表格图片,即可打印所需表格的目的。
技术领域
本发明涉及表格套打技术领域,特别是涉及一种表格识别套打方法、计算机设备及计算机可读存储介质。
背景技术
现代社会中,很多行业对各种表单、票据等有着十分严格的规范、限定条件,其格式是无法擅自更改的,一旦更改则会失效,所以通常情况下,需要先人工对各种表格进行设计,再进行使用,这种做法不仅效率低,而且耗时,人工成本较大。现有技术中也存在对于表格图像识别的方法,比如使用表格线交叉点分析方法提取表格线的方法过于耗时且稳定性较差,如中国发明专利申请说明书CN109948135A公开的一种基于表格特征归一化图像的方法及设备,其采用表格线交叉点分析法进行表格识别,从所述待识别图和模板图中选取至少一个位置相对应的单元格,并分别从选取的单元格中至少确认四个位于外边框上的顶点,所述待识别图中确认的顶点与所述模板图中确认的顶点位置相对应,形成至少四组相对应的顶点坐标等等,识别过程较为复杂且稳定性较差。因而,亟需发明一种表格识别套打方法、计算机设备及计算机可读存储介质,其能够实现了对表格的识别,并进行套打且剔除表格中的数据信息,利用计算机自动对表格进行套打来提高人们的办公效率,达到只需表格图片,即可打印所需表格的目的。
发明内容
为解决上述问题,本发明提供一种表格识别套打方法、计算机设备及计算机可读存储介质,其能够实现了对表格的识别,并进行套打且剔除表格中的数据信息,实现利用计算机自动对表格进行套打来提高人们的办公效率,达到只需表格图片,即可打印所需表格的目的。
为解决上述目的,本发明采用的如下技术方案。
一种表格识别套打方法,包括:
获取待识别的表格图像,并对采集到的表格图像进行预处理,得到预处理后的第一目标图像;
对预处理后的第一目标图像进行校正处理以获得第二目标图像;
提取第二目标图像的表格轮廓并进行细化处理获得第三目标图像;
根据第三目标图像分析表格横纵结构,以获得表格行列结构信息;
通过角点检测识别第三目标图像的角点位置,并结合表格行列结构信息,确定表格中单元格位置信息;
输出表格中单元格位置信息,以绘制表格实现表格套打。
进一步地,对预处理后的第一目标图像进行校正处理以获得第二目标图像之前,还包括检测第一目标图像的表格图像是否采集完整,具体如下:
检测第一目标的表格图像的外轮廓边界是否接触到图像的边缘;
检测第一目标的表格图像的外轮廓的轮廓端点数是否等于4个;
若判定表格外轮廓接触到图像边界或表格外轮廓端点数不是4个,则判断为表格拍摄不完整,返回重拍。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国信智能系统(广东)有限公司,未经国信智能系统(广东)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011010032.1/2.html,转载请声明来源钻瓜专利网。