[发明专利]数据仓库和数据集市的管理方法及装置有效

专利信息
申请号: 201710437789.0 申请日: 2017-06-12
公开(公告)号: CN109033113B 公开(公告)日: 2021-07-30
发明(设计)人: 杨泽森 申请(专利权)人: 北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司
主分类号: G06F16/22 分类号: G06F16/22;G06F16/28
代理公司: 北京律智知识产权代理有限公司 11438 代理人: 袁礼君;姜怡
地址: 100195 北京市海淀区杏石口路6*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 数据仓库 数据 集市 管理 方法 装置
【权利要求书】:

1.一种数据仓库和数据集市的管理方法,其特征在于,包括:

将数据源的生产数据抽取加工到Hadoop集群环境,在数据仓库集群中将数据按照第一数据存储架构存储;

在所述Hadoop集群环境中,根据业务划分或者组织架构,创建相应的Hadoop集群用户;

每个Hadoop集群用户下在数据集市集群上按照第二数据存储架构加工自身的数据模型,所述数据集市集群的数据来源于所述数据仓库集群,数据模型所描述的内容有三部分:数据结构、数据操作和数据约束,

所述第二数据存储架构包括多个数据层次,所述多个数据层次包括基础数据层、通用数据层、聚合数据层、应用数据层、维度层、集市维度层、临时层和开发层。

2.根据权利要求1所述的数据仓库和数据集市的管理方法,其特征在于,所述第一数据存储架构包括多个数据层次,所述多个数据层次包括数据缓冲层、基础数据层、通用数据层、聚合数据层、应用数据层、维度层、临时层和开发层。

3.根据权利要求1所述的数据仓库和数据集市的管理方法,其特征在于,每一个数据层次对应Hive的一个库,每个库在Hadoop HDFS上均对应一个分布式文件目录。

4.根据权利要求3所述的数据仓库和数据集市的管理方法,其特征在于,所述数据仓库集群与所述数据集市集群的HDFS存储架构包括HDFS命名空间、Hadoop集群用户、Hive库和模型表名;其中,

所述HDFS命名空间用于实现对不同业务分类的存储划分;

所述Hadoop集群用户用于实现管理HDFS目录权限;

对不同的所述Hadoop集群用户部署不同的Hive库,每个Hive库均会指向一个HDFS文件目录来保存其库下每个表的数据文件;

所述模型表名对应的模型表是Hive库中实现统计分析的模型,其在创建时数据会存储在对应的HDFS存储目录下。

5.根据权利要求4所述的数据仓库和数据集市的管理方法,其特征在在于,所述方法还包括:对各数据层次的模型表名实现规范管理。

6.根据权利要求5所述的数据仓库和数据集市的管理方法,其特征在于,所述对各数据层次的模型表名实现规范管理包括:

缓存数据层表名为BDM加源库名称加源表名;

基础数据层表名为FDM加源库名称加源表名加加载策略;

通用数据层表名为GDM加主题前缀加主体;

聚合数据层表名为ADM加主题英文简称加主体加后缀;

应用数据层表名为APP加主题英文简称加主体加后缀;

临时层表名为TMP加业务含义的表名;

维度层表名为DIM加业务含义的表名;

开发层表名为DEV加业务含义的表名;

集市维度层表名为DIM加业务含义的表名。

7.根据权利要求6所述的数据仓库和数据集市的管理方法,其特征在于,所述方法还包括:在所述数据集市集群中的子公司、业务条线或者部门能够创建自己独有的数据层次来实现特殊数据的存储。

8.一种数据仓库和数据集市的管理装置,其特征在于,包括:

数据仓库数据存储模块,用于将数据源的生产数据抽取加工到Hadoop集群环境,在数据仓库集群中将数据按照第一数据存储架构存储;

集群用户创建模块,用于在所述Hadoop集群环境中,根据业务划分或者组织架构,创建相应的Hadoop集群用户;

数据集群数据存储模块,用于每个Hadoop集群用户下在数据集市集群上按照第二数据存储架构加工自身的数据模型,所述数据集市集群的数据来源于所述数据仓库集群,数据模型所描述的内容有三部分:数据结构、数据操作和数据约束,

所述第二数据存储架构包括多个数据层次,所述多个数据层次包括基础数据层、通用数据层、聚合数据层、应用数据层、维度层、集市维度层、临时层和开发层。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司,未经北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201710437789.0/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top