[发明专利]表格图像处理方法和装置在审
申请号: | 202210564947.X | 申请日: | 2022-05-23 |
公开(公告)号: | CN114898387A | 公开(公告)日: | 2022-08-12 |
发明(设计)人: | 陆杰;庾悦晨;章成全;姚锟 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06V30/412 | 分类号: | G06V30/412;G06V30/414;G06V30/148;G06V10/82;G06N3/04;G06N3/08 |
代理公司: | 北京市汉坤律师事务所 11602 | 代理人: | 姜浩然;吴丽丽 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 表格 图像 处理 方法 装置 | ||
1.一种表格图像处理方法,包括:
获得目标图像,所述目标图像中包含表格,所述表格包括多个单元格和多个字符;
基于所述目标图像,确定所述表格的结构信息和文本信息,所述结构信息指示所述多个单元格中的每一个单元格的行列索引信息,所述文本信息包括所述多个字符中的每一个字符的位置;以及
基于所述结构信息和所述文本信息,确定所述多个单元格中的每一个单元格的边框位置。
2.根据权利要求1所述的方法,其中,所述基于所述结构信息和所述文本信息,确定所述表格的多个单元格中的每一个单元格的边框位置包括:
基于所述文本信息,获得所述多个单元格中每一个单元格对应的单元格文本,所述多个单元格中的每一个单元格对应的单元格文本包括所述多个字符中的至少一个字符;以及
基于所述多个单元格中的每一个单元格对应的单元格文本的位置和所述结构信息,确定所述多个单元格中的每一个单元格的边框位置。
3.根据权利要求2所述的方法,其中,所述基于所述文本信息,获得所述多个单元格中每一个单元格对应的单元格文本包括:
获得所述多个字符中基于语义识别的多个识别文本,所述多个识别文本中的每一个识别文本包括所述多个字符中的至少一个字符;以及
基于所述多个识别文本,获得所述多个单元格中每一个单元格对应的单元格文本。
4.根据权利要求3所述的方法,其中,所述基于所述目标图像,获得所述表格的结构信息和文本信息还包括:
获得所述多个单元格中的每一个单元格的预测边框的位置;其中,所述基于所述多个识别文本,获得所述多个单元格中每一个单元格对应的单元格文本包括:
针对所述多个识别文本中的每一个识别文本,基于该识别文本所包括的至少一个字符中的每一个字符的位置,获得包围该识别文本的包围框;以及
响应于所述多个识别文本中的第一识别文本的包围框的位置与所述多个单元格中的第一单元格的预测边框的位置之间的距离小于所述第一识别文本的包围框的位置与第二单元格的预测边框的位置之间的距离,将所述第一识别文本确定为所述第一单元格对应的单元格文本。
5.根据权利要求2所述的方法,其中,所述基于所述多个单元格中的每一个单元格对应的单元格文本的位置和所述结构信息,确定所述多个单元格中的每一个单元格的边框位置包括:
获得所述多个单元格文本中的每一个单元格文本,基于该单元格文本所包括的至少一个字符中的每一个字符的位置,获得包围该单元格文本的矩形包围框;以及
基于所述多个单元格文本对应的多个矩形包围框和所述结构信息,获得所述多个单元格中的每一个单元格的边框位置。
6.根据权利要求5所述的方法,其中,所述基于所述多个单元格文本对应的多个矩形包围框和所述结构信息,获得所述多个单元格中的每一个单元格的边框位置包括:
响应于确定所述多个矩形包围框中的第一矩形包围框与第二矩形包围框相应,确定所述第一矩形包围框与所述第二矩形包围框位于同一行;
获得所述多个矩形包围框中的多个矩形包围框集合,所述多个矩形包围框集合中的每一个矩形包围框集合中的多个矩形包围框位于同一行;以及
基于所述多个矩形包围框集合和所述结构信息,获得所述多个单元格中的每一个单元格的边框位置。
7.根据权利要求5所述的方法,其中,所述基于所述多个矩形包围框集合和所述结构信息,获得所述多个单元格中的每一个单元格包括:
基于所述多个矩形包围框集合,获得多个行分割线,所述多个行分割线中的每一个行分割线位于所述多个矩形包围框集合中的两个相邻矩形包围框集合之间;以及
基于所述多个矩形包围框集合中所包括的矩形包围框的数量最大的第一矩形包围框集合,获得多个列分割线,所述多个列分割线中的每一个列分割线位于所述第一矩形包围框集合的相邻两个矩形包围之间;
基于所述多个行分割线和所述多个列分割线,获得多个行列单元格;以及
基于所述多个行列单元格和所述结构信息,获得所述多个单元格中的每一个单元格的边框位置。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210564947.X/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序