[发明专利]表格检测方法、装置、移动终端及存储介质在审
申请号: | 201910972978.7 | 申请日: | 2019-10-14 |
公开(公告)号: | CN112733573A | 公开(公告)日: | 2021-04-30 |
发明(设计)人: | 李梦琴;张玉双;朴安妮;任若楠 | 申请(专利权)人: | 顺丰科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/20;G06N3/04;G06N3/08 |
代理公司: | 深圳翼盛智成知识产权事务所(普通合伙) 44300 | 代理人: | 彭绪坤 |
地址: | 518000 广东省深圳市南山区学府路(以南)*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 表格 检测 方法 装置 移动 终端 存储 介质 | ||
本申请实施例公开了一种表格检测方法、装置、移动终端及存储介质,本申请实施例可以获取待检测的表格图像;对所述表格图像进行表格检测,得到表格的特征信息;获取预设模板表格的目标特征信息;根据所述特征信息和所述目标特征信息,计算所述表格图像中的表格与所述预设模板表格之间的矩阵变换关系;根据所述矩阵变换关系确定所述表格图像中构成所述表格的各个区域。该方案可以基于表格图像中表格的特征信息,确定与预设模板表格之间的矩阵变换关系,从而可以根据矩阵变换关系有效及快速确定表格的各个区域,提高了表格检测的准确性和效率。
技术领域
本申请涉及计算机视觉技术领域,具体涉及一种表格检测方法、装置、移动终端及存储介质。
背景技术
随着信息技术的发展,数据信息开始指数级增长,在工程、统计、或科研等多种场景中,可能会存在很多纸质版或电子版的数据。其中,表格作为数据记录汇总中最精简的表达方式,包含了很多的有效信息,因此需要对表格进行检测,以便提取表格中的信息。
现有表格检测方法,一般是针对便携式文档格式(PDF,Portable DocumentForma)等电子表格进行检测,且检测方式比较简单,例如,只能对清晰表格直线进行检测,而对于图片格式的表格,由于受到图纸形变、拍摄角度、或拍摄光线等拍摄因素的影响,因此该图片格式的表格的图像质量较差,导致现有表格检测方法无法准确检测出表格。
发明内容
本申请实施例提供一种表格检测方法、装置、移动终端及存储介质,可以提高表格检测的准确性和效率。
第一方面,本申请实施例提供了一种表格检测方法,包括:
获取待检测的表格图像;
对所述表格图像进行表格检测,得到表格的特征信息;
获取预设模板表格的目标特征信息;
根据所述特征信息和所述目标特征信息,计算所述表格图像中的表格与所述预设模板表格之间的矩阵变换关系;
根据所述矩阵变换关系确定所述表格图像中构成所述表格的各个区域。
在一些实施方式中,所述根据所述矩阵变换关系确定所述表格图像中构成所述表格的各个区域之后,所述方法还包括:
检测所述区域内是否存在字符;
当所述区域内存在字符时,对所述区域内的字符进行识别。
在一些实施方式中,所述对所述表格图像进行表格检测,得到表格的特征信息包括:
通过预设的边缘检测模型对所述表格图像进行表格线检测,得到二值化的线条图像;
对所述线条图像进行特征提取,得到表格的特征信息。
在一些实施方式中,所述对所述线条图像进行特征提取,得到表格的特征信息包括:
获取所述线条图像中关键线条之间的交点;
将所述交点设置为所述表格的特征信息。
在一些实施方式中,所述通过预设的边缘检测模型对所述表格图像进行表格线检测,得到线条图像之前,所述方法还包括:
获取不同拍摄参数或者包含不同表格的多张样本图像,以及获取每张样本图像对应的目标二值化图像;
通过边缘检测模型基于每张样本图像生成二值化图像;
根据所述目标二值化图像和二值化图像对所述边缘检测模型的参数进行调整,得到预设的边缘检测模型。
在一些实施方式中,所述获取预设模板表格的目标特征信息包括:
通过预设的边缘检测模型对预设模板表格进行卷积操作,得到特征图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于顺丰科技有限公司,未经顺丰科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910972978.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:具有延迟功能的通用串行总线供电装置
- 下一篇:一种聚甲氧基二甲醚的生产方法