[发明专利]基于Infobright的数据仓库和系统及其构建方法有效

申请号：	201310582660.0	申请日：	2013-11-19
公开（公告）号：	CN103605732B	公开（公告）日：	2018-03-30
发明（设计）人：	者文明;李东	申请（专利权）人：	北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司
主分类号：	G06F17/30	分类号：	G06F17/30
代理公司：	北京邦信阳专利商标代理有限公司11012	代理人：	王昭林,胡冰
地址：	100080 北京***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：	一种基于Infobright的数据仓库，包括源数据仓，其存放从关系型数据库中抽取过来的原始数据；加工仓，其具有brighthouse引擎，所述加工仓为一主多从的集群架构，包括一个加工仓主库和多个加工仓从库，所述加工仓提取源数据仓中的原始数据，并对所述原始数据进行加工处理和存储。本发明还提供一种基于Infobright的数据仓库系统，其包括所述的基于Infobright的数据仓库；关系型数据库，其用于产生业务有关的原始数据；数据导入单元，其将所述原始数据导入到所述数据仓库中。本发明还提出了基于Infobright的数据仓库和系统的构件方法。本发明的数据仓库具有高性能且可扩展的优点。
搜索关键词：	基于 infobright 数据仓库系统及其构建方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

一种基于Infobright的数据仓库的构建方法，其特征在于，包括：构建源数据仓，所述源数据仓存放从关系型数据库中抽取过来的原始数据，源数据仓具有Infobright的brighthouse引擎，将所述原始数据从关系型数据库抽取到云存储，从云存储中下载所述原始数据到数据仓库中，原始数据均以增量的方式被加载到源数据仓中；构建加工仓，所述加工仓具有brighthouse引擎，所述加工仓为一主多从的集群架构，包括一个加工仓主库和多个加工仓从库，所述加工仓提取源数据仓中的原始数据，并对所述原始数据进行加工处理和存储，数据加工过程均在加工仓主库中完成，加工仓主库对所述原始数据的加工处理包括排重、合并、拆分，加工仓从库为读库；构建结果仓，所述结果仓具有MyISAM引擎，采用一主多从的集群架构，包括一个结果仓主库和多个结果仓从库，所述结果仓对加工仓加工完的数据进行汇总，作为汇总类报表的数据源；所述源数据仓被构建为，针对所述原始数据中的表，根据表中的主键字段和更新时间字段，从表中过滤出主键重复的记录中更新时间最新的一条记录，查询出所有主键不重复的记录集合，并通过load dataoutfile方式导出到文本文件中，该文本文件保存在源数据仓中。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司，未经北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201310582660.0/，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理
G06F17-00 特别适用于特定功能的数字计算设备或数据处理设备或数据处理方法
G06F17-10 .复杂数学运算的
G06F17-20 .处理自然语言数据的
G06F17-30 .信息检索；及其数据库结构
G06F17-40 .数据的获取和记录
G06F17-50 .计算机辅助设计

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]基于Infobright的数据仓库和系统及其构建方法有效

专利文献下载