[发明专利]配置化的文件解析方法及装置在审
申请号: | 202010916887.4 | 申请日: | 2020-09-03 |
公开(公告)号: | CN112051998A | 公开(公告)日: | 2020-12-08 |
发明(设计)人: | 方曦;赵奇;孙伟 | 申请(专利权)人: | 中国银行股份有限公司 |
主分类号: | G06F8/36 | 分类号: | G06F8/36 |
代理公司: | 北京三友知识产权代理有限公司 11127 | 代理人: | 吕俊刚;吴学锋 |
地址: | 100818 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 配置 文件 解析 方法 装置 | ||
1.一种配置化的文件解析方法,其特征在于,包括:
根据文本文件的结构,配置节点、节点处理类和节点处理规则;其中,节点为文本文件每一行的抽象,节点处理类为处理节点的类,节点处理规则为节点的解析规则;
根据节点的结构,配置单元、单元处理类和单元处理规则;其中,单元为文本文件中每一行按分隔符拆分后的列,单元处理类为处理单元的类,单元处理规则为单元的解析规则;
对文本文件,根据节点处理规则,通过节点处理类对节点进行解析;
对文本文件,根据单元处理规则,通过单元处理类对单元进行解析;
根据节点的解析结果,以及单元的解析结果,构建文本文件的解析结果。
2.如权利要求1所述的方法,其特征在于,节点包括起始节点、汇总节点、明细节点和结束节点;其中,起始节点为文本文件起始行信息,汇总节点为文本文件汇总行信息,明细节点为文本文件明细信息,结束节点为文本文件结束行信息。
3.如权利要求1所述的方法,其特征在于,还包括:
根据文本文件的结构,配置节点预处理规则;节点预处理规则为节点的预解析规则;
所述对文本文件,根据节点处理规则,通过节点处理类对节点进行解析之前,还包括:根据节点预处理规则,通过节点处理类对节点进行预解析。
4.如权利要求1所述的方法,其特征在于,还包括:
根据文本文件的结构,配置节点后处理规则;节点后处理规则为节点的后解析规则;
所述对文本文件,根据单元处理规则,通过单元处理类对单元进行解析之后,还包括:根据节点后处理规则,通过节点处理类对节点进行后解析。
5.如权利要求1所述的方法,其特征在于,还包括:
根据节点的结构,配置单元预处理规则;单元预处理规则为单元的预解析规则;
所述对文本文件,根据单元处理规则,通过单元处理类对单元进行解析之前,还包括:根据单元预处理规则,通过单元处理类对单元进行预解析。
6.如权利要求1所述的方法,其特征在于,还包括:
根据节点的结构,配置单元后处理规则;单元后处理规则为单元的后解析规则;
所述对文本文件,根据单元处理规则,通过单元处理类对单元进行解析之后,还包括:根据单元后处理规则,通过单元处理类对单元进行后解析。
7.如权利要求1所述的方法,其特征在于,配置节点处理类,包括:
在节点处理类中配置节点相关信息;其中,节点相关信息包括节点中的列信息和/或分隔符。
8.如权利要求1至7任一项所述的方法,其特征在于,对文本文件,根据节点处理规则,通过节点处理类对节点进行解析,包括:对属于同一类别的多个文本文件,并行对节点进行解析;
对文本文件,根据单元处理规则,通过单元处理类对单元进行解析,包括:对属于同一类别的多个文本文件,并行对单元进行解析;
根据节点的解析结果,以及单元的解析结果,构建文本文件的解析结果,包括:对属于同一类别的多个文本文件,并行构建文本文件的解析结果;
其中,所述同一类别的多个文本文件的结构相同。
9.一种配置化的文件解析装置,其特征在于,包括:
节点配置模块,用于根据文本文件的结构,配置节点、节点处理类和节点处理规则;其中,节点为文本文件每一行的抽象,节点处理类为处理节点的类,节点处理规则为节点的解析规则;
单元配置模块,用于根据节点的结构,配置单元、单元处理类和单元处理规则;其中,单元为文本文件中每一行按分隔符拆分后的列,单元处理类为处理单元的类,单元处理规则为单元的解析规则;
节点解析模块,用于对文本文件,根据节点处理规则,通过节点处理类对节点进行解析;
单元解析模块,用于对文本文件,根据单元处理规则,通过单元处理类对单元进行解析;
结果构建模块,用于根据节点的解析结果,以及单元的解析结果,构建文本文件的解析结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国银行股份有限公司,未经中国银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010916887.4/1.html,转载请声明来源钻瓜专利网。