[发明专利]基于Infobright的数据仓库和系统及其构建方法有效
申请号: | 201310582660.0 | 申请日: | 2013-11-19 |
公开(公告)号: | CN103605732B | 公开(公告)日: | 2018-03-30 |
发明(设计)人: | 者文明;李东 | 申请(专利权)人: | 北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京邦信阳专利商标代理有限公司11012 | 代理人: | 王昭林,胡冰 |
地址: | 100080 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种基于Infobright的数据仓库,包括源数据仓,其存放从关系型数据库中抽取过来的原始数据;加工仓,其具有brighthouse引擎,所述加工仓为一主多从的集群架构,包括一个加工仓主库和多个加工仓从库,所述加工仓提取源数据仓中的原始数据,并对所述原始数据进行加工处理和存储。本发明还提供一种基于Infobright的数据仓库系统,其包括所述的基于Infobright的数据仓库;关系型数据库,其用于产生业务有关的原始数据;数据导入单元,其将所述原始数据导入到所述数据仓库中。本发明还提出了基于Infobright的数据仓库和系统的构件方法。本发明的数据仓库具有高性能且可扩展的优点。 | ||
搜索关键词: | 基于 infobright 数据仓库 系统 及其 构建 方法 | ||
【主权项】:
一种基于Infobright的数据仓库的构建方法,其特征在于,包括:构建源数据仓,所述源数据仓存放从关系型数据库中抽取过来的原始数据,源数据仓具有Infobright的brighthouse引擎,将所述原始数据从关系型数据库抽取到云存储,从云存储中下载所述原始数据到数据仓库中,原始数据均以增量的方式被加载到源数据仓中;构建加工仓,所述加工仓具有brighthouse引擎,所述加工仓为一主多从的集群架构,包括一个加工仓主库和多个加工仓从库,所述加工仓提取源数据仓中的原始数据,并对所述原始数据进行加工处理和存储,数据加工过程均在加工仓主库中完成,加工仓主库对所述原始数据的加工处理包括排重、合并、拆分,加工仓从库为读库;构建结果仓,所述结果仓具有MyISAM引擎,采用一主多从的集群架构,包括一个结果仓主库和多个结果仓从库,所述结果仓对加工仓加工完的数据进行汇总,作为汇总类报表的数据源;所述源数据仓被构建为,针对所述原始数据中的表,根据表中的主键字段和更新时间字段,从表中过滤出主键重复的记录中更新时间最新的一条记录,查询出所有主键不重复的记录集合,并通过load dataoutfile方式导出到文本文件中,该文本文件保存在源数据仓中。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司,未经北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201310582660.0/,转载请声明来源钻瓜专利网。
- 上一篇:网页模板生成方法和服务器
- 下一篇:一种组合生物填料及其除臭装置