[发明专利]图片表格自动提取方法及系统在审

申请号：	202010494300.5	申请日：	2020-06-03
公开（公告）号：	CN111640133A	公开（公告）日：	2020-09-08
发明（设计）人：	高垚;翟帅华	申请（专利权）人：	上海铭垚信息科技有限公司
主分类号：	G06T7/194	分类号：	G06T7/194;G06K9/32;G06T5/00;G06T3/00;G06K9/34;G06T7/90
代理公司：	北京兴智翔达知识产权代理有限公司 11768	代理人：	蒋常雪
地址：	200090 上海市杨浦***	国省代码：	上海;31
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	图片表格自动提取方法系统
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明实施例提供一种图片表格自动提取方法及系统，该方法包括以下步骤：步骤S1：对原图进行预处理，分离前景色和背景；步骤S2：对每个连续的前景色部分逐个描绘包落区域；步骤S3：检索面积最大的包落区域，以定位表格主体部分；步骤S4：通过切线方式在最大的包落边框上定位四个表格顶点，并对四点表格顶点位置进行微调和矫正；步骤S5：通过四个表格顶点的位置估算透视角度，进行透视还原；步骤S6：定位出标准长方形，提取表格的最终矫正图。该图片表格自动提取方法及系统通过图像处理技术，自动识别表格边框线的方式进行表格的提取和矫正，规避了自然场景的照片的各种干扰以及表格内容的识别对表格线本身识别的干扰，提取的准确率高。

技术领域

本发明涉及图片提取领域，尤其涉及一种图片表格自动提取方法及系统。

背景技术

OCR(Optical Character Recognition，光学字符识别)是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符，通过检测暗、亮的模式确定其形状，然后用字符识别方法将形状翻译成计算机文字的过程；即，针对印刷体字符，采用光学的方式将纸质文档中的文字转换成为黑白点阵的图像文件，并通过识别软件将图像中的文字转换成文本格式，供文字处理软件进一步编辑加工的技术。

开发一个OCR文字识别软件系统，其目的很简单，只是要把影像作一个转换，使影像内的图形继续保存、有表格则表格内资料及影像内的文字，一律变成计算机文字，使能达到影像资料的储存量减少、识别出的文字可再使用及分析，当然也可节省因键盘输入的人力与时间。从影像到结果输出，须经过影像输入、影像前处理、文字特征抽取、比对识别、最后经人工校正将认错的文字更正，将结果输出。

自然场景的照片可能有各种干扰项，例如图片上的表格旁边多了一个杯子、一支笔或者多了一道阴影，而且当前技术更多注重自然场景照片的英文字母、汉字等的文字识别，对表格内容的识别较少涉及，表格线本身往往也被识别成为了干扰项，因此导致数据提取失败或者准确率极低。

公开于该背景技术部分的信息仅仅旨在增加对本发明的总体背景的理解，而不应当被视为承认或以任何形式暗示该信息构成已为本领域一般技术人员所公知的现有技术。

发明内容

针对现有技术存在的问题，本发明实施例提供一种图片表格自动提取方法及系统。

第一方面，本发明实施例提供一种图片表格自动提取方法，包括以下步骤：

步骤S1：对原图进行预处理，分离前景色和背景；

步骤S2：对每个连续的前景色部分逐个描绘包落区域；

步骤S3：检索面积最大的包落区域，以定位表格主体部分；

步骤S4：通过切线方式在最大的包落边框上定位四个表格顶点，并对四点表格顶点位置进行微调和矫正；

步骤S5：通过四个表格顶点的位置估算透视角度，进行透视还原；

步骤S6：定位出标准长方形，提取表格的最终矫正图。

进一步地，步骤S1中对原图进行预处理包括：降噪和二值化。