[发明专利]一种基于模板对异构污染源集成数据的解析方法无效
申请号: | 201110387870.5 | 申请日: | 2011-11-29 |
公开(公告)号: | CN102521292A | 公开(公告)日: | 2012-06-27 |
发明(设计)人: | 朱利;常飞;谢海江;何金星;米玥;曾柯;崔凯楠;鲍帅 | 申请(专利权)人: | 西安交通大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 西安通大专利代理有限责任公司 61200 | 代理人: | 陆万寿 |
地址: | 710049 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 模板 污染源 集成 数据 解析 方法 | ||
1.一种基于模板对异构污染源集成数据的解析方法,其特征在于,包括以下步骤:
1)根据用户的需求,在异构污染源集成数据处理器中进行以下构建:
构建用户表,每个用户表包含多个域,每个域存储异构污染源集成数据中一个属性字段的值;
构建包含多个属性映射的模板,模板记录异构污染源集成数据中的属性字段与对应的用户表中的域的映射关系,一个属性字段与用户表中的域的对应关系成为一个属性映射;
构建模板表,模板表是模板的集合,保存每个用户表唯一对应的模板;
构建数据映射表,数据映射表保存异构污染源集成数据与将要被保存到的用户表的映射关系,以及用户表和模板的唯一映射,数据映射表中的主键值索引为集成数据中选定的主属性字段的值;
2)在数据进行解析时,首先从待解析的异构污染源集成数据中读取主属性字段的值生成数据映射表中的主键值索引,然后根据主键值索引查找数据映射表保存的异构污染源集成数据所对应的模板的集合,以及对应的将被保存的用户表,再根据模板对异构污染源集成数据进行解析,从异构污染源集成数据中获取对应属性字段的值,待数据解析完成后,将解析好的数据存储到对应的用户表中或将数据进行显示。
2.如权利要求1所述的基于模板对异构污染源集成数据的解析方法,其特征在于,所述的模板中,一个属性映射由四元组组成,分别为属性字段名,对应的用户表中的域名,属性字段的作用域以及属性字段值的数据类型。
3.如权利要求1所述的基于模板对异构污染源集成数据的解析方法,其特征在于,所述的数据映射表包括key、tables_name和templates_name,其中key为主键值索引,从异构污染源集成数据中选择一个或者多个全局属性字段组成;通过key索引到异构污染源集成数据对应的用户表以及用于解析的模板;
tables_name记录异构污染源集成数据对应存储的用户表的表名;
templates_name记录tables_name用户表对应用于数据解析的模板,多个模板按照用户表的先后顺序依次连接。
4.如权利要求1所述的基于模板对异构污染源集成数据的解析方法,其特征在于,在数据进行解析时,按照以下步骤进行:
Step1:从一条集成数据Data中取选定的用于区别数据类别的主字段属性的值,生成数据映射表的主键值索引Key;
Step2:根据Key,从数据映射表中查找解析数据对应的用户表集和用户表对应的模板集;一条集成数据对应的用户表为一个或多个,一个用户表对应一个模板,确定模板集中元素的数量tpN;
Step3:将Data中的所有项目数据进行分离得到项目数据集Cell,确定Cell中元素的数量cellN;
Step4:从模板集取元素Templatei,将Templatei中属性映射分离得到属性映射集Tuple,确定Tuple元素数量tuN;
Step5:从项目数据集Cell中取元素Cellj
Step6:从属性映射集Tuple中取元素Tuplek,在Cellj查找对应的属性的值,如找到返回属性值Val,否则返回Val为NULL值;
Step7:Ret[i][j][k]=Val,k加1,若k<tuN,转入Step6;否则,进入下一步;
Step8:j加1,若j<cellN,转入Step5;否则,进入下一步;
Step9:i加1,若i<tpN,转入Step4;否则,进入下一步;
Step10:将Ret中解析的数据按照数据库的格式和规范存储到对应的用户表中。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安交通大学,未经西安交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110387870.5/1.html,转载请声明来源钻瓜专利网。