[发明专利]一种DataVault模型数据仓库自动构建的方法及装置有效
申请号: | 201510272096.1 | 申请日: | 2015-05-25 |
公开(公告)号: | CN104866576B | 公开(公告)日: | 2018-03-02 |
发明(设计)人: | 简宋全;李青海;侯大勇;邹立斌;许飞月 | 申请(专利权)人: | 广东精点数据科技股份有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京隆源天恒知识产权代理事务所(普通合伙)11473 | 代理人: | 闫冬 |
地址: | 广东省广州市天河*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 data vault 模型 数据仓库 自动 构建 方法 装置 | ||
技术领域
本发明涉及一种数据仓库的构建领域,具体涉及一种Data Vault模型数据仓库自动构建的方法及装置。
背景技术
Data Vault是一种构建数据仓库的建模方法,无论数据在当时业务层面的对与错,这种建模方法保留所有的历史数据。用这种建模方法构建的数据仓库称为企业级的数据仓库,它包括了从企业各个数据库集成过来的所有的历史数据,它位于业务系统和数据集市之间,也是数据集市的唯一数据来源。Data Vault是面向细节,可追踪历史的,它是一组有连接关系的规范化的表的集合,这些表可以支持一个或多个业务功能。Data Vault只按照业务数据的原样保存数据,不做任何解释、过滤、清洗、转换。Data Vault模型的主要组成部分包括了中心表、链接表和附属表。中心表相当于业务实体表,包含业务实体的主键即业务主键,链接表是链接业务实体的表,其中包含了中心表中的业务主键,用于将中心表链接起来,代表了业务主键的业务关系。中心表和链接表是用于呈现业务实体和业务实体之间逻辑关系的表,其包含的字段只有代理键和时间戳等信息,附属表则是依附于中心表或者链接表,用于完成对业务实体或业务实体之间关系的信息的补充。企业数据仓库构建人员需要在源数据库中寻找业务实体并将业务主键和业务主键之间的关系按照Data Vault的建模规范集合到中心表、链接表和附属表当中。
Data Vault模型所建立的数据仓库与构建普通的数据仓库最大的不同在于构建的过程。原有的数据仓库直接构成数据集市,是面向主题的,需要在这个层面上给业务决策人展现业务报表,于是它的数据仓库构建过程需要按照每一次不同的主题来进行数据抽取、抓换和加载,数据抽取、转换和加载三项过程都会因主题的不同而有所变化。而企业数据仓库是面向历史的,它构建的数据仓库是一种包含了所有历史信息,包括错误的和重复的信息的数据仓库,它可以再经过数据处理来获得各个方面各个层面的报表,它不是直接面向业务决策人员的,而它的内容非常灵活,而且不再依赖于源数据库。
但是现如今的技术人员仍按照构建普通数据仓库的方式构建企业级数据仓库,即目前的构建普通数据仓库的技术包括了先构建逻辑上的中心表、链接表和附属表,再根据逻辑构建的表与表之间的关系,从源数据库中逐个抽取表的内容并建表。无法批量式构建企业数据仓库,费时费力。
鉴于上述缺陷,本发明创作者经过长时间的研究和试验,最终获得了本发明。
发明内容
本发明的目的在于提供一种Data Vault模型数据仓库自动构建的方法及装置,用以克服上述技术缺陷。
为实现上述目的,本发明采用的技术方案在于:
一方面提供一种Data Vault模型数据仓库自动构建装置,该构建装置包括表查询装置和建表装置,
所述表查询装置,用于接收用户输入的中心字段组,所述中心字段组包括多个中心字段,并对所述中心字段组进行处理后,输出总体信息表和中心字段关联信息表;所述总体信息表记录有所述中心字段组中每一个中心字段以及该中心字段的主表和附表在源数据库表中的表号信息,所述中心字段关联信息表记录有所述中心字段组中所有的中心字段相互之间的逻辑关系;
所述建表装置,用于接收所述总体信息表和中心字段关联信息表,通过分析处理所述中心字段关联信息表得到中间表,再根据所述中间表得到中心字段组合信息表后,再根据所述总体信息表自动创建中心表,根据所述中心字段组合信息表自动创建链接表,根据源数据库表和所述中心表自动创建附属表,完成企业级数据仓库的构建。
进一步,所述表查询装置包括第一初始化单元、搜索单元、判断单元、写入单元、匹配单元和记录单元;
所述第一初始化单元,用于对所述中心字段组进行初始化,并形成初始化中心字段关联信息表;
所述搜索单元,用于在源数据库表中寻找具有被搜索中心字段的表;
所述判断单元,用于判断所述被搜索中心字段在具有所述被搜索中心字段的表中是否为主键,如果是主键,则将具有所述被搜索中心字段的表作为所述被搜索中心字段的主表;如果不是主键,则将具有所述被搜索中心字段的表作为所述被搜索中心字段的附表;
所述写入单元,用于将所述被搜索中心字段和具有所述被搜索中心字段的主表和附表的信息写入所述总体信息表中;
所述匹配单元,用于查询所述被搜索中心字段的附表,将用户输入的中心字段组中其他中心字段与所述被搜索中心字段的附表进行匹配查询,若所述被搜索中心字段的附表中有其他中心字段,则将其他中心字段设为所述被搜索中心字段的主动关联中心字段;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东精点数据科技股份有限公司,未经广东精点数据科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510272096.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:显示页面信息的方法和装置
- 下一篇:一种基于智能设备的磨牙检测方法及检测系统