[发明专利]一种基于多维理论的数据仓库模型建设系统及方法在审
申请号: | 201911124899.7 | 申请日: | 2019-11-18 |
公开(公告)号: | CN111078766A | 公开(公告)日: | 2020-04-28 |
发明(设计)人: | 陈旋;王冲;郝大松 | 申请(专利权)人: | 江苏艾佳家居用品有限公司 |
主分类号: | G06F16/25 | 分类号: | G06F16/25;G06F16/28 |
代理公司: | 南京正联知识产权代理有限公司 32243 | 代理人: | 邓唯 |
地址: | 211100 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 多维 理论 数据仓库 模型 建设 系统 方法 | ||
本发明公开了一种基于多维理论的数据仓库模型建设系统及其建设方法,属于数据仓库领域,基于多维模型设计的基础上改进,通过将设计模型的元数据在元模型中沉淀下来,充分利用元数据自动构建星型多维数据模型,缩短数据模型设计;系统包括元数据模型、维度及层次、度量组及度量、数据方体、物理模型等模块,通过构建这一系列的模块实现数据仓库物理模型自动化产生,本发明采用了单独构建多维设计元模型,抛弃了传统的数据模型设计工具,实现了基于数据模型元数据把物理模型脚本产生自动化,与传统的设计相比缩短了数据模型设计过程,提高了数据仓库建设的效率。
技术领域
本发明属于数据仓库领域,尤其涉及一种基于多维理论的数据仓库模型建设系统及其建设方法。
背景技术
构建数据仓库的过程中,数据仓库模型是基础,数据的处理过程(ETL)是核心。
一般传统的构建过程是首先是通过数据建模工具构建多维数据模型,在建设模型的过程中需要人工的创建大量的维度表和事实表,耗费了非常多的人力,并且很难使用标准规范约束,就导致了产出的数据模型不规范、不统一,给后续的数据处理和数据的应用带来不必要的工作量开销和隐患。
其次是数据处理过程(ETL),传统的ETL过程是人工根据数据仓库模型设计ETL的映射处理关系,然后ETL工程师根据ETL设计文档开发ETL任务,这样做的ETL任务很难保障和数据仓库模型的设计保持一致,带来了大量的测试和反复修改的工作量。
发明内容
本发明所要解决的技术问题是针对背景技术的不足提供一种基于多维理论的数据仓库模型建设系统及其建设方法,通过改进设计方法、将设计元数据通过元模型沉淀下来,充分利用元模型数据内容构建建设数据仓库需要的物理数据模型,缩短数据仓库的建设过程,为数据处理过程ETL提供元数据支持。
本发明为解决上述技术问题采用以下技术方案:
一种基于多维理论的数据仓库模型建设系统,包括元数据模型模块、维度及层次模块、度量组及度量模块、数据方体模块、物理模型等模块;
其中,元数据模型模块,用于管理和存储数据仓库模型元数据;
维度及层次模块,用于定义数据仓库模型中的维度模型;
度量组及度量模块,用于定义数据仓库中的度量模型;
数据方体模块,用于定义整个数据仓库模型,是将维度模型和度量模型结合后构建的模型;
物理模型,用于构建实体数据仓库的数据模型,是最终的输出结果。
一种基于多维理论的数据仓库模型建设系统的建设方法,具体包含如下步骤;
步骤1,定义维度,维度是看数据的视角,通过对业务需求的理解分析,梳理出相应的数据维度信息,定义维度的描述信息;
步骤2,定义维度层次,维度的层次是数据计算从低粒度往高粒度计算和观察的基础,定义维度层次的描述信息;
步骤3,定义度量组,度量组是一组相关性的度量的集合,是构建数据主题应用的基础,定义度量组的描述信息;
步骤4,定义度量,度量即衡量业务的标准,是按照维度观察分析的具体内容,通过分析业务需求分析,整理出相关的度量,如销售数量、销售金额、客户数量、采购数量、采购金额等等,定义度量的描述信息,包括所属度量组、度量代码、度量名称、度量的计算方法(聚合、平均、最大、最小、计数)、排序号;
步骤5,构建数据方体,根据业务需求分析,根据步骤1的维护维度和步骤3的度量组的关系,构建成数据方体;
步骤6,保存用电子表格或者开发相应的软件实现的元数据,将步骤1至步骤5产生的元数据包含维度、维度层次、度量组、度量和数据方体保存到元模型中;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江苏艾佳家居用品有限公司,未经江苏艾佳家居用品有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911124899.7/2.html,转载请声明来源钻瓜专利网。