[发明专利]表格线检测方法、装置、设备及计算机可读介质有效
申请号: | 201811076344.5 | 申请日: | 2018-09-14 |
公开(公告)号: | CN109308465B | 公开(公告)日: | 2020-01-17 |
发明(设计)人: | 杨静远;毕研广;韩钧宇 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00 |
代理公司: | 11313 北京市铸成律师事务所 | 代理人: | 杨瑾瑾;陈建焕 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 表格线 检测 计算机可读介质 直线区域 直线段 直线图 图像 最大连通域 投影曲线 | ||
本发明实施例一种表格线检测方法、装置、设备及计算机可读介质,所述表格线检测方法包括:获取具有表格线的图像;从所述图像中提取多个直线段,以获得包括所述多个直线段的直线图;将所述直线图中的最大连通域确定为直线区域;根据所述直线区域的投影曲线确定所述表格线的位置。本发明实施例的技术方案可以提高表格线检测速度,提升检测效果。
技术领域
本发明涉及信息处理技术领域,尤其涉及一种表格线检测方法、装置、设备及计算机可读介质。
背景技术
本部分旨在为权利要求书中陈述的本发明的实施例提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。
表格是一种重要的信息载体,能够简洁直观地保存并呈现复杂数据,便于人们分析问题。考虑到保密性和稳定性,当前大部分表格为纸质文档。但为了方便海量数据的管理,很多情况下需要将纸质文档通过光学字符识别(OCR,Optical CharacterRecognition)技术结构化输出为Excel等电子文档。常见的M×N型表格具有齐全的表格线,因此表格线检测定位是整个M×N型表格识别的前提条件和关键技术之一。
常用的表格线检测方法包括:采用霍夫(Hough)变换提取二值图像中的所有直线,再将检测到的直线分为水平线和竖直线,然后通过一系列的线段修整算法例如剔除小线段、合并连接相邻线、剔除表格外部线等,得到最终表格线检测结果。通过Hough变换检测直线耗时较长,同时密集文字堆积到一起时容易在各个方向上都产生直线响应,使得最后检测结果中存在大量噪声线段干扰,影响最终检测结果。另外,在后续线段修整环节中采用了较多算法,算法执行中一个环节出错都会导致最终结果产生较大偏差,整体鲁棒性很差。
发明内容
本发明实施例提供一种表格线检测方法、装置、设备及计算机可读介质,以至少解决现有技术中的一个或多个技术问题。
第一方面,本发明实施例提供了一种表格线检测方法,包括:
获取具有表格线的图像;
从所述图像中提取多个直线段,以获得包括所述多个直线段的直线图;
将所述直线图中的最大连通域确定为直线区域;
根据所述直线区域的投影曲线确定所述表格线的位置。
结合第一方面,本发明实施例在第一方面的第一种实施方式中,将所述直线图中的最大连通域确定为直线区域,包括:
对于所述直线图中的每一个连通域,如果所述连通域的面积小于面积设定值并且所述连通域的长宽比不符合设定区间,则删除所述连通域。
结合第一方面,本发明实施例在第一方面的第二种实施方式中,根据所述直线区域的投影曲线确定所述表格线的位置,包括:
将所述直线区域中的每个像素在水平方向和竖直方向分别做投影,以获得水平投影曲线和竖直投影曲线;
基于所述水平投影曲线的波峰位置确定所述表格线的竖直线的位置,以及基于所述竖直投影曲线的波峰位置确定所述表格线的水平线的位置。
结合第一方面的第二种实施方式,本发明实施例在第一方面的第三种实施方式中,基于所述水平投影曲线的波峰位置确定所述表格线的竖直线的位置,包括:
设置若干个等间隔的第一波峰高度阈值;
使用多个第一波峰高度阈值分割所述水平投影曲线;
分别记录所述水平投影曲线中高于每个第一波峰高度阈值的像素的数量,以得到第一波峰高度变化曲线;
基于所述第一波峰高度变化曲线获取第一波峰高度梯度曲线;
根据所述第一波峰高度梯度曲线获得第一自适应波峰高度阈值;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811076344.5/2.html,转载请声明来源钻瓜专利网。