[发明专利]一种表单文件解析方法及装置在审
申请号: | 201610078128.9 | 申请日: | 2016-02-04 |
公开(公告)号: | CN105760450A | 公开(公告)日: | 2016-07-13 |
发明(设计)人: | 郑明建 | 申请(专利权)人: | 浪潮通用软件有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 济南信达专利事务所有限公司 37100 | 代理人: | 李世喆 |
地址: | 250100 山东*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 表单 文件 解析 方法 装置 | ||
技术领域
本发明涉及数据处理技术领域,特别涉及一种表单文件解析方法及装置。
背景技术
随着计算机技术的飞速发展,在企业办公领域内包括大量的表单文件,这些表单文件一般用于实现采购信息、会计信息、保税信息、物流信息和销售信息的存储。通常在信息系统开发和实施过程中,对于表单文件的解析十分重要。
目前,在针对不同业务类型的表单文件进行解析时,往往会开发多种解析方式,以利用不同的解析方式实现对相应业务类型的表单文件的解析。
然而,对于表单文件的业务类型较多,且可能存在需要对表单文件进行解析时,信息系统中不包括该业务类型表单文件所对应的解析方式,从而导致无法对该表单文件进行解析,进而影响表单文件解析的效率。
发明内容
本发明实施例提供了一种表单文件解析方法及装置,以实现对表单文件的解析。
第一方面,本发明通过了一种表单文件解析方法,预先配置第一格式组和第二格式组;所述方法还包括:
获取待解析的目标表单文件;
根据所述目标表单文件,构建包括有所述第一格式组的第一列表和包括有所述第二格式组的第二列表;
根据所述第一列表和所述第二列表,对所述目标表单文件进行解析。
优选地,在所述目标表单文件的个数为多个时,且该多个目标表单文件的业务功能相同,则构建的所述第一列表中包括该多个目标表单文件中每一个目标表单文件所对应的第一格式组,构建的所述第二列表中包括该多个目标表单文件中每一个目标表单文件所对应的第二格式组。
优选地,所述第一格式组包括配置编号、配置名称、表头所在行、表头类型、数据开始行、数据开始列和头检查标识中的至少一种;
和/或,
所述第二格式组包括:配置编号、字段KEY、字段英文名、字段中文名、排序号、数据宽度、是否可为空、校验方式、是否校验、是否定宽、数据精度中的至少一种。
优选地,所述对所述目标表单文件进行解析,包括:
获取所述目标表单文件的文件名称,并根据文件名称确定所述目标表单文件的文件类型;
根据所述目标表单文件的文件类型,调用与所述目标表单文件的文件类型相对应的API接口读取所述目标表单文件,并在根据所述第一列表中头检查标识确定需要对所述目标表单文件的表头进行校验时,根据所述第一列表中的表头所在行对所述目标表单文件的表头进行校验,以及根据所述第二列表中的校验方式以及所述第一列表中的数据开始行和所述数据开始列对所述目标表单文件的内容进行校验。
优选地,在对所述目标表单文件进行解析之后,进一步包括:
针对所述目标表单文件生成第三列表,以使信息系统获知已执行对所述目标表单文件的解析,其中,所述第三列表包括:ROW_ID、配置编号、租户编号、租户名称、用户编号、用户名称、服务器IP、文件目录、文件名中的至少一种。
优选地,所述对所述目标表单文件的内容进行校验之后,进一步包括:在校验结果错误时,生成第四列表,并将所述第四列表进行反馈,以使信息系统根据所述第四列表对所述目标表单文件进行处理;其中,所述第四列表包括:ROW_ID、批次ID、配置编号、文件ID、错误行、列名和错误信息中至少一种。
第二方面,本发明还提供了一种表单文件解析装置,包括:
配置单元,用于配置第一格式组和第二格式组,并将所述第一格式组和第二格式组发送给构建单元;
获取单元,用于获取待解析的目标表单文件,并将所述目标表单文件发送给所述构建单元;
所述构建单元,用于根据所述目标表单文件,构建包括有所述第一格式组的第一列表和包括有所述第二格式组的第二列表,并将所述第一列表和所述第二列表发送给解析单元;
所述解析单元,用于根据所述第一列表和所述第二列表,对所述目标表单文件进行解析。
优选地,所述构建单元,具体用于在所述目标表单文件的个数为多个时,且该多个目标表单文件的业务功能相同时,构建包括该多个目标表单文件中每一个目标表单文件所对应的第一格式组的第一列表,构建包括该多个目标表单文件中每一个目标表单文件所对应的第二格式组的第二列表。
优选地,所述第一格式组包括配置编号、配置名称、表头所在行、表头类型、数据开始行、数据开始列和头检查标识中的至少一种;
和/或,
所述第二格式组包括:配置编号、字段KEY、字段英文名、字段中文名、排序号、数据宽度、是否可为空、校验方式、是否校验、是否定宽、数据精度中的至少一种。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浪潮通用软件有限公司,未经浪潮通用软件有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610078128.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:基于关联数据查询的人机交互方法及装置
- 下一篇:用于过滤垃圾词的方法及系统