[发明专利]数据仓库和数据集市的管理方法及装置有效
申请号: | 201710437789.0 | 申请日: | 2017-06-12 |
公开(公告)号: | CN109033113B | 公开(公告)日: | 2021-07-30 |
发明(设计)人: | 杨泽森 | 申请(专利权)人: | 北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司 |
主分类号: | G06F16/22 | 分类号: | G06F16/22;G06F16/28 |
代理公司: | 北京律智知识产权代理有限公司 11438 | 代理人: | 袁礼君;姜怡 |
地址: | 100195 北京市海淀区杏石口路6*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据仓库 数据 集市 管理 方法 装置 | ||
1.一种数据仓库和数据集市的管理方法,其特征在于,包括:
将数据源的生产数据抽取加工到Hadoop集群环境,在数据仓库集群中将数据按照第一数据存储架构存储;
在所述Hadoop集群环境中,根据业务划分或者组织架构,创建相应的Hadoop集群用户;
每个Hadoop集群用户下在数据集市集群上按照第二数据存储架构加工自身的数据模型,所述数据集市集群的数据来源于所述数据仓库集群,数据模型所描述的内容有三部分:数据结构、数据操作和数据约束,
所述第二数据存储架构包括多个数据层次,所述多个数据层次包括基础数据层、通用数据层、聚合数据层、应用数据层、维度层、集市维度层、临时层和开发层。
2.根据权利要求1所述的数据仓库和数据集市的管理方法,其特征在于,所述第一数据存储架构包括多个数据层次,所述多个数据层次包括数据缓冲层、基础数据层、通用数据层、聚合数据层、应用数据层、维度层、临时层和开发层。
3.根据权利要求1所述的数据仓库和数据集市的管理方法,其特征在于,每一个数据层次对应Hive的一个库,每个库在Hadoop HDFS上均对应一个分布式文件目录。
4.根据权利要求3所述的数据仓库和数据集市的管理方法,其特征在于,所述数据仓库集群与所述数据集市集群的HDFS存储架构包括HDFS命名空间、Hadoop集群用户、Hive库和模型表名;其中,
所述HDFS命名空间用于实现对不同业务分类的存储划分;
所述Hadoop集群用户用于实现管理HDFS目录权限;
对不同的所述Hadoop集群用户部署不同的Hive库,每个Hive库均会指向一个HDFS文件目录来保存其库下每个表的数据文件;
所述模型表名对应的模型表是Hive库中实现统计分析的模型,其在创建时数据会存储在对应的HDFS存储目录下。
5.根据权利要求4所述的数据仓库和数据集市的管理方法,其特征在在于,所述方法还包括:对各数据层次的模型表名实现规范管理。
6.根据权利要求5所述的数据仓库和数据集市的管理方法,其特征在于,所述对各数据层次的模型表名实现规范管理包括:
缓存数据层表名为BDM加源库名称加源表名;
基础数据层表名为FDM加源库名称加源表名加加载策略;
通用数据层表名为GDM加主题前缀加主体;
聚合数据层表名为ADM加主题英文简称加主体加后缀;
应用数据层表名为APP加主题英文简称加主体加后缀;
临时层表名为TMP加业务含义的表名;
维度层表名为DIM加业务含义的表名;
开发层表名为DEV加业务含义的表名;
集市维度层表名为DIM加业务含义的表名。
7.根据权利要求6所述的数据仓库和数据集市的管理方法,其特征在于,所述方法还包括:在所述数据集市集群中的子公司、业务条线或者部门能够创建自己独有的数据层次来实现特殊数据的存储。
8.一种数据仓库和数据集市的管理装置,其特征在于,包括:
数据仓库数据存储模块,用于将数据源的生产数据抽取加工到Hadoop集群环境,在数据仓库集群中将数据按照第一数据存储架构存储;
集群用户创建模块,用于在所述Hadoop集群环境中,根据业务划分或者组织架构,创建相应的Hadoop集群用户;
数据集群数据存储模块,用于每个Hadoop集群用户下在数据集市集群上按照第二数据存储架构加工自身的数据模型,所述数据集市集群的数据来源于所述数据仓库集群,数据模型所描述的内容有三部分:数据结构、数据操作和数据约束,
所述第二数据存储架构包括多个数据层次,所述多个数据层次包括基础数据层、通用数据层、聚合数据层、应用数据层、维度层、集市维度层、临时层和开发层。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司,未经北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710437789.0/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置