[发明专利]一种图像中的表格识别方法、装置、电子设备及存储介质有效

专利信息
申请号: 202010697220.X 申请日: 2020-07-20
公开(公告)号: CN111814722B 公开(公告)日: 2022-04-19
发明(设计)人: 孔垂鑫;王鉴宇;郑嘉文;李文;段立新 申请(专利权)人: 电子科技大学
主分类号: G06V30/413 分类号: G06V30/413;G06V30/146;G06V30/148;G06V30/19;G06K9/62;G06N3/04
代理公司: 北京正华智诚专利代理事务所(普通合伙) 11870 代理人: 李林合
地址: 611731 四川省成*** 国省代码: 四川;51
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 图像 中的 表格 识别 方法 装置 电子设备 存储 介质
【权利要求书】:

1.一种图像中的表格识别方法,其特征在于,包括以下步骤:

S1、获取待识别的包含表格区域的图像;

S2、分别利用深度学习模型和直线检测方法对所述图像进行级联矫正;

S3、利用深度学习模型检测出经级联矫正后图像中的表格区域;

S4、从所述表格区域中检测出行列表格线,重建表格结构;

所述步骤S4包括以下步骤:

S401、对所述表格区域进行文本检测处理,获取文本检测框,并对所述文本检测框进行后处理;

S402、对所述表格区域进行二值化处理,获取二值图像;

S403、消除二值图像中的文字和噪声,获取移除噪声和文字的二值图像;

S404、从移除噪声和文字的二值图像中检测可见表格线;

S405、根据所述可见表格线的数量对表格类型进行分类;

S406、根据分类结果,从文本检测框的掩模图像中检测表格区域中的不可见表格线;

S407、对所述可见表格线以及不可见表格线进行后处理,移除错误的表格线,完成对表格结构的重建;

所述步骤S403包括以下步骤:

S4031、根据表格区域的文本检测框构建基于文本检测框的文本检测框掩模图像;

S4032、根据所述文本检测框掩模图像消除二值表格区域图像中的文字像素;

S4033、遍历二值表格区域图像上的全部连通域,并计算得到每个连通域的最小外接矩形;

S4034、判断所述最小外接矩形的尺寸是否满足预设的尺寸,若是,则将连通域对应的像素从表格图像中移除,获取移除噪声和文字的二值图像,并进入步骤S404,否则,返回步骤S4033;

S5、分割所述表格结构中单元格内的文本,并利用文本识别模型对单元格内的文本进行识别;

S6、对识别结果进行格式化输出,完成对图像中表格的识别。

2.根据权利要求1所述的图像中的表格识别方法,其特征在于,所述步骤S2包括以下步骤:

S201、利用深度学习模型对所述图像进行横竖向分类,将图像调整为横向;

S202、分别利用文本检测方法和文本识别方法对横向图像进行正倒分类,将图像调整为正向;

S203、利用霍夫变换直线检测方法对正向图像进行矫正。

3.根据权利要求1所述的图像中的表格识别方法,其特征在于,在所述步骤S401之前还包括步骤S400;

S400、对经级联矫正后图像中的表格区域进行二次倾斜矫正处理。

4.根据权利要求1所述的图像中的表格识别方法,其特征在于,所述步骤S404包括以下步骤:

S4041、分别生成横向卷积核和纵向卷积核;

所述横向卷积核的宽度w表达式如下:

w=W*ratio

所述纵向卷积核的宽度表达式如下:

h=H*ratio

其中,W和H分别表示表格区域图像的宽度和高度,ratio表示比例系数;

S4042、将横向卷积核在移除噪声和文字的二值图像中进行二维卷积操作,过滤出横向线条,去除纵向线条;以及

将纵向卷积核在移除噪声和文字的二值图像中进行二维卷积操作,过滤出纵向线条,去除横向线条;

S4043、将经横向卷积核卷积后的二值图像沿水平方法进行投影,统计前景像素数量,获得横向投影序列;以及

将经纵向卷积后的二值图像沿垂直方法进行投影,统计前景像素数量,获得纵向投影序列;

S4044、利用峰值检测算法分别在所述横向投影序列和纵向投影序列中查找峰值坐标,得到横向线条对应的纵坐标和纵向线条对应的横坐标,完成对可见表格线的检测,并进入步骤S405。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010697220.X/1.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top