[发明专利]一种图像中的表格识别方法、装置、电子设备及存储介质有效
申请号: | 202010697220.X | 申请日: | 2020-07-20 |
公开(公告)号: | CN111814722B | 公开(公告)日: | 2022-04-19 |
发明(设计)人: | 孔垂鑫;王鉴宇;郑嘉文;李文;段立新 | 申请(专利权)人: | 电子科技大学 |
主分类号: | G06V30/413 | 分类号: | G06V30/413;G06V30/146;G06V30/148;G06V30/19;G06K9/62;G06N3/04 |
代理公司: | 北京正华智诚专利代理事务所(普通合伙) 11870 | 代理人: | 李林合 |
地址: | 611731 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 图像 中的 表格 识别 方法 装置 电子设备 存储 介质 | ||
1.一种图像中的表格识别方法,其特征在于,包括以下步骤:
S1、获取待识别的包含表格区域的图像;
S2、分别利用深度学习模型和直线检测方法对所述图像进行级联矫正;
S3、利用深度学习模型检测出经级联矫正后图像中的表格区域;
S4、从所述表格区域中检测出行列表格线,重建表格结构;
所述步骤S4包括以下步骤:
S401、对所述表格区域进行文本检测处理,获取文本检测框,并对所述文本检测框进行后处理;
S402、对所述表格区域进行二值化处理,获取二值图像;
S403、消除二值图像中的文字和噪声,获取移除噪声和文字的二值图像;
S404、从移除噪声和文字的二值图像中检测可见表格线;
S405、根据所述可见表格线的数量对表格类型进行分类;
S406、根据分类结果,从文本检测框的掩模图像中检测表格区域中的不可见表格线;
S407、对所述可见表格线以及不可见表格线进行后处理,移除错误的表格线,完成对表格结构的重建;
所述步骤S403包括以下步骤:
S4031、根据表格区域的文本检测框构建基于文本检测框的文本检测框掩模图像;
S4032、根据所述文本检测框掩模图像消除二值表格区域图像中的文字像素;
S4033、遍历二值表格区域图像上的全部连通域,并计算得到每个连通域的最小外接矩形;
S4034、判断所述最小外接矩形的尺寸是否满足预设的尺寸,若是,则将连通域对应的像素从表格图像中移除,获取移除噪声和文字的二值图像,并进入步骤S404,否则,返回步骤S4033;
S5、分割所述表格结构中单元格内的文本,并利用文本识别模型对单元格内的文本进行识别;
S6、对识别结果进行格式化输出,完成对图像中表格的识别。
2.根据权利要求1所述的图像中的表格识别方法,其特征在于,所述步骤S2包括以下步骤:
S201、利用深度学习模型对所述图像进行横竖向分类,将图像调整为横向;
S202、分别利用文本检测方法和文本识别方法对横向图像进行正倒分类,将图像调整为正向;
S203、利用霍夫变换直线检测方法对正向图像进行矫正。
3.根据权利要求1所述的图像中的表格识别方法,其特征在于,在所述步骤S401之前还包括步骤S400;
S400、对经级联矫正后图像中的表格区域进行二次倾斜矫正处理。
4.根据权利要求1所述的图像中的表格识别方法,其特征在于,所述步骤S404包括以下步骤:
S4041、分别生成横向卷积核和纵向卷积核;
所述横向卷积核的宽度w表达式如下:
w=W*ratio
所述纵向卷积核的宽度表达式如下:
h=H*ratio
其中,W和H分别表示表格区域图像的宽度和高度,ratio表示比例系数;
S4042、将横向卷积核在移除噪声和文字的二值图像中进行二维卷积操作,过滤出横向线条,去除纵向线条;以及
将纵向卷积核在移除噪声和文字的二值图像中进行二维卷积操作,过滤出纵向线条,去除横向线条;
S4043、将经横向卷积核卷积后的二值图像沿水平方法进行投影,统计前景像素数量,获得横向投影序列;以及
将经纵向卷积后的二值图像沿垂直方法进行投影,统计前景像素数量,获得纵向投影序列;
S4044、利用峰值检测算法分别在所述横向投影序列和纵向投影序列中查找峰值坐标,得到横向线条对应的纵坐标和纵向线条对应的横坐标,完成对可见表格线的检测,并进入步骤S405。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010697220.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种新能源汽车用零磁通宽量程电流互感器装置
- 下一篇:一种电子检测装置
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序