[发明专利]一种表格结构识别方法在审
申请号: | 202110904049.X | 申请日: | 2021-08-06 |
公开(公告)号: | CN113627318A | 公开(公告)日: | 2021-11-09 |
发明(设计)人: | 张美慧;李辉超 | 申请(专利权)人: | 北京理工大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00 |
代理公司: | 北京云嘉湃富知识产权代理有限公司 11678 | 代理人: | 程凌军 |
地址: | 100081 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种表格结构识别方法,属于模式识别技术领域。包括两个过程:初始行列生成阶段和行列生成阶段。在初始行列生成阶段,通过启发式的算法将有重叠区域的单元格组织成初始行与初始列;由于没有重叠关系的单元格也可能存在同行/列关系,因此在行列生成阶段,利用图神经网络来主要预测没有重叠区域的单元格之间的行列关系,作为遗漏关系的补充;为了降低预测的计算复杂度,单元格之间的关系实际上通过预测单元格与初始行/初始列之间的关系得到。对比现有技术,本发明减少了模型需要判断关系的单元格数,并基于初始行与初始列给后续图模型的构建以及特征提取提供了先验知识;最后能够生成表格的行与列,其能完全还原表格的结构。 | ||
搜索关键词: | 一种 表格 结构 识别 方法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京理工大学,未经北京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202110904049.X/,转载请声明来源钻瓜专利网。