[发明专利]文档表格解析方法及装置在审
申请号: | 201910388152.6 | 申请日: | 2019-05-09 |
公开(公告)号: | CN110110313A | 公开(公告)日: | 2019-08-09 |
发明(设计)人: | 纪大胜;苌奥林;张渝洋;谢华 | 申请(专利权)人: | 上海微投股权投资基金管理有限公司 |
主分类号: | G06F17/24 | 分类号: | G06F17/24 |
代理公司: | 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 | 代理人: | 崔振 |
地址: | 200120 上海市浦东新区中国*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供一种文档表格解析方法及装置,涉及文件解析技术领域。该方法包括获取非编辑文档中待识别表格相关的线段特征信息,线段特征信息包括:线段的坐标信息;根据线段特征信息,获取待识别表格中横线段信息及竖线段信息;根据待识别表格中横线段信息及竖线段信息,获取初始表格信息;根据初始表格信息和线段的坐标信息,生成与待识别表格对应的可编辑表格。通过线段特征信息获取待识别表格中横线段信息和竖线段信息,并根据该横线段信息和竖线段信息,获取初始表格信息,最后根据初始表格信息和待识别表格相关的线段特征信息,生成待识别表格对应的可编辑表格。该方法有效解决了复合表格及缺线表格还原复杂度高,还原效果差的问题。 | ||
搜索关键词: | 线段特征 表格信息 横线 竖线 线段 文档表格 坐标信息 解析 编辑文档 还原效果 文件解析 信息获取 有效解决 复杂度 还原 复合 | ||
【主权项】:
1.一种文档表格解析方法,其特征在于,包括:获取非编辑文档中待识别表格相关的线段特征信息,所述线段特征信息包括:线段的坐标信息;根据所述线段特征信息,获取所述待识别表格中横线段信息及竖线段信息;根据所述待识别表格中横线段信息及竖线段信息,获取初始表格信息;根据所述初始表格信息和所述线段的坐标信息,生成与所述待识别表格对应的可编辑表格。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海微投股权投资基金管理有限公司,未经上海微投股权投资基金管理有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910388152.6/,转载请声明来源钻瓜专利网。