[发明专利]图片表格自动提取方法及系统在审
申请号: | 202010494300.5 | 申请日: | 2020-06-03 |
公开(公告)号: | CN111640133A | 公开(公告)日: | 2020-09-08 |
发明(设计)人: | 高垚;翟帅华 | 申请(专利权)人: | 上海铭垚信息科技有限公司 |
主分类号: | G06T7/194 | 分类号: | G06T7/194;G06K9/32;G06T5/00;G06T3/00;G06K9/34;G06T7/90 |
代理公司: | 北京兴智翔达知识产权代理有限公司 11768 | 代理人: | 蒋常雪 |
地址: | 200090 上海市杨浦*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图片 表格 自动 提取 方法 系统 | ||
1.一种图片表格自动提取方法,其特征在于,包括以下步骤:
步骤S1:对原图进行预处理,分离前景色和背景;
步骤S2:对每个连续的前景色部分逐个描绘包落区域;
步骤S3:检索面积最大的包落区域,以定位表格主体部分;
步骤S4:通过切线方式在最大的包落边框上定位四个表格顶点,并对四点表格顶点位置进行微调和矫正;
步骤S5:通过四个表格顶点的位置估算透视角度,进行透视还原;
步骤S6:定位出标准长方形,提取表格的最终矫正图。
2.根据权利要求1所述的图片表格自动提取方法,其特征在于,所述步骤S1中对原图进行预处理包括:降噪和二值化。
3.根据权利要求2所述的图片表格自动提取方法,其特征在于,所述降噪指根据图片噪声的特征进行去噪,所述图片噪声包括:环境背景、光照、文档上的印章或签名涂改、以及图片本身的拍摄模糊或者曝光不均匀。
4.根据权利要求3所述的图片表格自动提取方法,其特征在于,所述二值化指将整个图像前景信息定义为黑色,背景信息定义为白色,使其呈现出明显的黑白效果的过程。
5.一种图片表格自动提取系统,其特征在于,包括:
预处理模块:用于对原图进行预处理,分离前景色和背景;
表格主体定位模块:用于对每个连续的前景色部分逐个描绘包落区域,并检索面积最大的包落区域,以定位表格主体部分;
定位表格顶点模块:用于通过切线方式在最大的包落边框上定位四个表格顶点,并对四点表格顶点位置进行微调和矫正;
透视还原模块:用于通过四个表格顶点的位置估算透视角度,进行透视还原;
提取表格模块:用于定位出标准长方形,提取表格的最终矫正图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海铭垚信息科技有限公司,未经上海铭垚信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010494300.5/1.html,转载请声明来源钻瓜专利网。