[发明专利]一种基于OFD文档的表格提取方法在审
申请号: | 201811343405.X | 申请日: | 2018-11-13 |
公开(公告)号: | CN109492211A | 公开(公告)日: | 2019-03-19 |
发明(设计)人: | 不公告发明人 | 申请(专利权)人: | 江西金格科技股份有限公司 |
主分类号: | G06F17/24 | 分类号: | G06F17/24 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 330096 江西省南昌市*** | 国省代码: | 江西;36 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于OFD文档的表格提取方法,包括数据解析功能流程和数据应用功能流程,将应用层和逻辑层分离,使两部分互不影响,解决了因为文档格式及应用程序环境因素导致无法从OFD文档中提取表格的问题。实现了OFD文档表格提取的功能。架构清晰明了,便于理解、容易实现、方便调试程序及后期维,护增强了提取技术的扩展性。完全基于OFD文档的标准格式,几乎不需要除本发明方法外的其它软件支持,降低成本。可以达到无损的进行表格提取。且可提取和编辑表格内的文字等相关信息。 | ||
搜索关键词: | 文档 表格提取 功能流程 应用程序环境 标准格式 调试程序 软件支持 数据解析 数据应用 文档表格 文档格式 相关信息 扩展性 逻辑层 应用层 无损 架构 清晰 | ||
【主权项】:
1.一种基于OFD文档的表格提取方法,包括应用接口模块、数据管理模块、数据提取模块和数据解析模块,其特征在于,所述应用接口模块:提供通俗易懂的接口函数,给上层应用调用;同时,负责调用数据管理模块用以实现接口函数;所述数据管理模块:用于对数据提取模块和数据解析模块的调度,同时用于汇总由数据提取模块和数据解析模块的数据内容,并将数据交付给应用接口模块使用;所述数据提取模块:对OFD文档进行解析,从OFD文档中提取所有数据,并将其按表格数据对象和非表格数据对象分类,并将分类数据统一交给数据管理模块进行统一分配管理;所述数据解析模块:从数据管理模块中获取到表格数据对象,通过表格边框查找算法,将所有表格数据对象进行统一归类处理,得出表格对象,并将表格对象组成表格列表,并将表格列表交给数据管理模块。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江西金格科技股份有限公司,未经江西金格科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811343405.X/,转载请声明来源钻瓜专利网。