[发明专利]表格图像解析方法、装置、计算机设备及存储介质在审
申请号: | 201910115443.8 | 申请日: | 2019-02-13 |
公开(公告)号: | CN109948440A | 公开(公告)日: | 2019-06-28 |
发明(设计)人: | 刘克亮 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/34 |
代理公司: | 深圳市立智方成知识产权代理事务所(普通合伙) 44468 | 代理人: | 王增鑫 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 表格图像 目标表格 预处理 字符内容 表格线 解析 计算机设备 表格结构 表格解析 表格数据 布局生成 垂直投影 存储介质 输入表格 水平投影 投影算法 图像 | ||
1.一种表格图像解析方法,其特征在于,所述方法包括:
输入表格图像,并对所述表格图像进行预处理;
对预处理后的表格图像进行水平投影以及进行垂直投影,得到所述表格图像的目标表格布局;
识别出所述目标表格布局中的字符内容,依据所述字符内容以及所述目标表格布局生成所述表格图像的表格。
2.根据权利要求1所述的表格图像解析方法,其特征在于,所述输入表格图像,并对所述表格图像进行预处理,包括:
对所述表格图像进行二值化处理得到二值图;
检测所述二值图中的横向线条,并去除所述横向线条;
检测出竖向线条,并去除检测出的竖向线条。
3.根据权利要求2所述的表格图像解析方法,其特征在于,所述对所述表格图像进行二值化处理得到二值图,包括:
对所述表格图像进行灰度处理得到灰度图;
对所述灰度图运用最大稳定极值区域算法得到所述二值图。
4.根据权利要求1所述的表格图像解析方法,其特征在于,所述对预处理后的表格图像进行水平投影以及进行垂直投影,得到所述表格图像的目标表格布局,包括:
对预处理后的表格图像进行水平投影得到行切割区域;
对预处理后的表格图像进行垂直投影得到列切割区域;
依据所述行切割区域以及所述列切割区域对所述表格图像进行图像分割,生成所述目标表格布局以及若干个单元格图像。
5.根据权利要求4所述的表格图像解析方法,其特征在于,所述识别出所述目标表格布局中的字符内容,依据所述字符内容以及所述目标表格布局生成所述表格图像的表格,包括:
依据所述目标表格布局绘制所述表格图像的表框结构;
识别出所述单元格图像中的字符内容;
将所述字符内容对应填入所述表框结构中,生成所述表格图像的表格。
6.根据权利要求1所述的表格图像解析方法,其特征在于,所述对预处理后的表格图像进行水平投影以及进行垂直投影,得到所述表格图像的目标表格布局之前,包括:
对所述预处理后的表格图像进行横向膨胀使区域连通。
7.根据权利要求1所述的表格图像解析方法,其特征在于,还包括:
检测所述表格图像中是否包含网格线;
若所述表格图像包含网格线,则提取所述表格图像的原始表格布局;
将所述原始表格布局与所述目标表格布局进行比对,以验证所述目标表格布局。
8.一种表格图像解析装置,其特征在于,所述方法包括:
输入模块,用于输入表格图像,并对所述表格图像进行预处理;
投影模块,用于对预处理后的表格图像进行水平投影以及进行垂直投影,得到所述表格图像的目标表格布局;
生成模块,用于识别出所述目标表格布局中的字符内容,依据所述字符内容以及所述目标表格布局生成所述表格图像的表格。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现权利要求1至7中任一项所述表格图像解析方法的步骤。
10.一种计算机设备,其特征在于,包括存储器和处理器,所述存储器中存储有计算机可读指令,所述计算机可读指令被所述处理器执行时,使得所述处理器执行如权利要求1至7中任一项权利要求所述表格图像解析方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910115443.8/1.html,转载请声明来源钻瓜专利网。