[发明专利]用于扫描图像中的表格信息的数据结构生成在审
申请号: | 202010405509.X | 申请日: | 2020-05-14 |
公开(公告)号: | CN112131920A | 公开(公告)日: | 2020-12-25 |
发明(设计)人: | A·F·罗德瑞格兹;M·嘉芭拉尼;W·法尔鲁克 | 申请(专利权)人: | 国际商业机器公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06N3/08;G06N20/10 |
代理公司: | 中国贸促会专利商标事务所有限公司 11038 | 代理人: | 刘玉洁 |
地址: | 美国*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 扫描 图像 中的 表格 信息 数据结构 生成 | ||
本申请涉及用于扫描图像中的表格信息的数据结构生成。提供了用于生成表示扫描图像中的表格信息的数据结构的计算机实现的方法。这样的方法可以包括:存储表示表格的扫描图像的图像数据;处理图像数据以识别图像中的字符和线的位置;以及根据所述位置映射信息单元格在图像中的位置,每个信息单元格包含一组字符。该方法还可以包括,对于每个单元格,根据单元格定位来确定用于预定义的单元格属性集的单元格属性值,并将该属性值作为输入提供给机器学习模型,该机器学习模型被训练为根据单元格属性值将单元格预分类为标题单元格或数据单元格。
技术领域
本公开总体上涉及用于扫描图像中的表格信息的数据结构生成。提供了用于生成表示这样的表格信息的数据结构的方法,以及实现这样的方法的装置和计算机程序产品。
背景技术
科学、医学和财务文档通常以表格形式描绘结构化信息。出于共享和存档目的,文档经常被扫描,并且所得到的扫描(光栅)图像被存储用于后续信息检索。扫描图像中的表格的结构是不能容易地由基于计算机的技术读取。在表格的结构、复杂性和可视化表示方面存在巨大的可变性。例如,表格标题可以以多种方式被结构化,以指示数据的行和列与分层的标题之间的对应关系。这种可变性对从扫描图像中自动提取表格信息提出了重大挑战。
发明内容
根据本发明的一个方面,提供了一种用于生成表示扫描图像中的表格信息的数据结构的计算机实现的方法。该方法包括:存储表示表格的扫描图像的图像数据;处理图像数据以识别图像中的字符和线的位置;以及根据所述位置映射信息单元格在图像中的定位,每个信息单元格包含一组字符。该方法包括,对于每个单元格,根据单元格定位来确定用于预定义的单元格属性集的单元格属性值,并将该属性值作为输入提供给机器学习模型,该机器学习模型被训练为根据单元格属性值将单元格预分类为标题单元格或数据单元格。然后,该方法将预定义的规则应用于预分类的单元格以识别角落数据单元格,该角落数据单元格标记图像中包含数据单元格的区域和包含标题单元格的边缘区域之间的过渡。该方法还包括,对于行标题单元格集和列标题单元格集中的每一个,根据图像中这些单元格的相对定位,定义层次树,层次树指示标题单元格的层次结构,并使用层次树来生成将每个数据单元格映射到层次结构中对应的行和列标题单元格的数据结构。所得到的数据结构被存储以提供表格的可查询表示。
本发明的又一方面提供了一种计算机程序产品,该计算机程序产品包括体现程序指令的计算机可读存储介质,该程序指令可由计算装置执行,以使计算装置执行如上所述的用于生成数据结构的方法。
本发明的另一方面提供了一种计算装置,该计算装置包括用于存储表示表格的扫描图像的图像数据的存储器,以及适于实现如上所述的用于生成数据结构的方法的逻辑。
下面将通过说明性和非限制性示例,参照附图更详细地描述本发明的实施例。
附图说明
图1是用于实现体现本发明的方法的计算装置的示意图;
图2a至图2g示出了不同的表格结构的示例;
图3是用于实现体现本发明的方法的计算装置的组件模块的示意图;
图4指示了体现本发明的数据结构生成方法的步骤;
图5指示了体现本发明的方法的附加步骤;
图6a至图6c示出了图4方法中的对象检测步骤;
图7a至图7d示出了图4方法中的单元格检测步骤;
图8示出了数据结构生成方法的优选实施例中的单元格分类过程;
图9a至图9d示出了优选实施例中的单元格分析步骤;
图10a和图10b示出了图4方法中的层次提取操作的步骤;
图11指示了优选实施例中的层次提取过程的步骤;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国际商业机器公司,未经国际商业机器公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010405509.X/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序