[发明专利]处理表格的方法、计算设备和计算机可读存储介质有效
申请号: | 202110616829.4 | 申请日: | 2021-06-03 |
公开(公告)号: | CN113065536B | 公开(公告)日: | 2021-09-14 |
发明(设计)人: | 张世坤;李景阳 | 申请(专利权)人: | 北京欧应信息技术有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/34 |
代理公司: | 北京市金杜律师事务所 11256 | 代理人: | 酆迅 |
地址: | 100020 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 处理 表格 方法 计算 设备 计算机 可读 存储 介质 | ||
本公开提供了一种处理表格的方法、计算设备和计算机可读存储介质。该方法包括:对扭曲图像进行文本框检测,以获取所述扭曲图像中的多个文本框的位置数据;对所述扭曲图像进行表格线检测,以获取所述扭曲图像中的多条表格线;基于所述多个文本框的位置数据,通过最大匹配行列算法确定多个第一单元格;基于所述多条表格线对所述多个第一单元格进行曲线拟合以确定每个第一单元格周围的拟合曲线段和延长线数据;以及基于每个第一单元格周围的拟合曲线段和延长线数据对所述多个第一单元格进行连通域校正以确定所述表格的多个单元格和每个单元格中的文本内容。
技术领域
本发明概括而言涉及图像处理领域,更具体地,涉及一种处理表格的方法、计算设备和计算机可读存储介质。
背景技术
当前,在许多应用领域中需要对图像中的文本进行识别,从而开发了各种各样的光学字符识别(OCR)技术。在学术论文或者科研报告中常常包括表格来描述学术进展或者实验结果。在医学领域,各种检测结果也通常是以表格形式展现。针对图像中的表格识别也已经提出了多种方案。然而,在实际的应用场景中,常常会遇到扭曲变形的图像,从而这种图像中的表格也是扭曲的表格,如何准确识别这些扭曲表格以重构出结构化表格目前尚无很好的解决方案。
对于扭曲表格识别,当前主流的方法是在常规表格识别技术的基础上对图像进行畸变校正、仿射变换等来解决简单的形变。此外,还存在着基于深度学习的图卷积方式和基于表格线的检测方法等。
然而,上述常规方法的效率低、鲁棒性弱、没有解决扭曲表格的算法,基于深度学习的图卷积方法过度依赖文本框检测结果,如果结果出现缺失,则容易导致整个结果的错误,而基于表格线的检测方法要求训练扭曲图片数据的种类过多,数据标注工作量庞大,并且存在断线问题,无法精确判断每条断线之间的关系,导致无法确定表格结构。
自然场景应用的OCR识别之后的版面分析,受到图片扭曲的场景影响很多。因此本发有效解决扭曲后无法进行结构化提取的问题,提升OCR的适应性。
发明内容
针对上述问题中的至少一个,本发明提供了一种处理表格的方案,其利用拓扑学原理,通过将文本框检测信息与表格线检测信息进行合理运算来准确确定扭曲表格中的每个单元格及其文本内容。
根据本发明的一个方面,提供了一种处理表格的方法。该方法包括:对扭曲图像进行文本框检测,以获取所述扭曲图像中的多个文本框的位置数据;对所述扭曲图像进行表格线检测,以获取所述扭曲图像中的多条表格线;基于所述多个文本框的位置数据,通过最大匹配行列算法确定多个第一单元格;基于所述多条表格线对所述多个第一单元格进行曲线拟合以确定每个第一单元格周围的拟合曲线段和延长线数据;以及基于每个第一单元格周围的拟合曲线段和延长线数据对所述多个第一单元格进行连通域校正以确定所述表格的多个单元格和每个单元格中的文本内容。
根据本发明的另一个方面,提供了一种计算设备。该计算设备包括:至少一个处理器;以及至少一个存储器,该至少一个存储器被耦合到该至少一个处理器并且存储用于由该至少一个处理器执行的指令,该指令当由该至少一个处理器执行时,使得该计算设备执行根据上述方法的步骤。
根据本发明的再一个方面,提供了一种计算机可读存储介质,其上存储有计算机程序代码,该计算机程序代码在被运行时执行如上所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京欧应信息技术有限公司,未经北京欧应信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110616829.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种系统评测方法及装置
- 下一篇:一种可见光激发的智能隔热变色的玻璃幕墙系统