[发明专利]图片表格自动提取方法及系统在审
申请号: | 202010494300.5 | 申请日: | 2020-06-03 |
公开(公告)号: | CN111640133A | 公开(公告)日: | 2020-09-08 |
发明(设计)人: | 高垚;翟帅华 | 申请(专利权)人: | 上海铭垚信息科技有限公司 |
主分类号: | G06T7/194 | 分类号: | G06T7/194;G06K9/32;G06T5/00;G06T3/00;G06K9/34;G06T7/90 |
代理公司: | 北京兴智翔达知识产权代理有限公司 11768 | 代理人: | 蒋常雪 |
地址: | 200090 上海市杨浦*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图片 表格 自动 提取 方法 系统 | ||
本发明实施例提供一种图片表格自动提取方法及系统,该方法包括以下步骤:步骤S1:对原图进行预处理,分离前景色和背景;步骤S2:对每个连续的前景色部分逐个描绘包落区域;步骤S3:检索面积最大的包落区域,以定位表格主体部分;步骤S4:通过切线方式在最大的包落边框上定位四个表格顶点,并对四点表格顶点位置进行微调和矫正;步骤S5:通过四个表格顶点的位置估算透视角度,进行透视还原;步骤S6:定位出标准长方形,提取表格的最终矫正图。该图片表格自动提取方法及系统通过图像处理技术,自动识别表格边框线的方式进行表格的提取和矫正,规避了自然场景的照片的各种干扰以及表格内容的识别对表格线本身识别的干扰,提取的准确率高。
技术领域
本发明涉及图片提取领域,尤其涉及一种图片表格自动提取方法及系统。
背景技术
OCR(Optical Character Recognition,光学字符识别)是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程;即,针对印刷体字符,采用光学的方式将纸质文档中的文字转换成为黑白点阵的图像文件,并通过识别软件将图像中的文字转换成文本格式,供文字处理软件进一步编辑加工的技术。
开发一个OCR文字识别软件系统,其目的很简单,只是要把影像作一个转换,使影像内的图形继续保存、有表格则表格内资料及影像内的文字,一律变成计算机文字,使能达到影像资料的储存量减少、识别出的文字可再使用及分析,当然也可节省因键盘输入的人力与时间。从影像到结果输出,须经过影像输入、影像前处理、文字特征抽取、比对识别、最后经人工校正将认错的文字更正,将结果输出。
自然场景的照片可能有各种干扰项,例如图片上的表格旁边多了一个杯子、一支笔或者多了一道阴影,而且当前技术更多注重自然场景照片的英文字母、汉字等的文字识别,对表格内容的识别较少涉及,表格线本身往往也被识别成为了干扰项,因此导致数据提取失败或者准确率极低。
公开于该背景技术部分的信息仅仅旨在增加对本发明的总体背景的理解,而不应当被视为承认或以任何形式暗示该信息构成已为本领域一般技术人员所公知的现有技术。
发明内容
针对现有技术存在的问题,本发明实施例提供一种图片表格自动提取方法及系统。
第一方面,本发明实施例提供一种图片表格自动提取方法,包括以下步骤:
步骤S1:对原图进行预处理,分离前景色和背景;
步骤S2:对每个连续的前景色部分逐个描绘包落区域;
步骤S3:检索面积最大的包落区域,以定位表格主体部分;
步骤S4:通过切线方式在最大的包落边框上定位四个表格顶点,并对四点表格顶点位置进行微调和矫正;
步骤S5:通过四个表格顶点的位置估算透视角度,进行透视还原;
步骤S6:定位出标准长方形,提取表格的最终矫正图。
进一步地,步骤S1中对原图进行预处理包括:降噪和二值化。
进一步地,降噪指根据图片噪声的特征进行去噪,所述图片噪声包括:环境背景、光照、文档上的印章或签名涂改、以及图片本身的拍摄模糊或者曝光不均匀。
进一步地,二值化指将整个图像前景信息定义为黑色,背景信息定义为白色,使其呈现出明显的黑白效果的过程。
第二方面,本发明实施例提供一种图片表格自动提取系统,包括:
预处理模块:用于对原图进行预处理,分离前景色和背景;
表格主体定位模块:用于对每个连续的前景色部分逐个描绘包落区域,并检索面积最大的包落区域,以定位表格主体部分;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海铭垚信息科技有限公司,未经上海铭垚信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010494300.5/2.html,转载请声明来源钻瓜专利网。