[发明专利]用于根据数据仓库提供统计信息的方法和系统有效
申请号: | 201280009577.8 | 申请日: | 2012-02-20 |
公开(公告)号: | CN103548019B | 公开(公告)日: | 2017-07-07 |
发明(设计)人: | G·纳斯 | 申请(专利权)人: | 阿玛得斯两合公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 中国国际贸易促进委员会专利商标事务所11038 | 代理人: | 金晓 |
地址: | 法国*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 根据 数据仓库 提供 统计 信息 方法 系统 | ||
技术领域
本发明整体上主要涉及数据仓库和商业智能,并且更具体地致力于解决在考虑提供统计数据时加快数据检索以实时处理从大型数据储存库中查询的问题。
本发明涉及特定的内存中的数据结构,其允许明显加快针对通常在商业智能中使用的大量数据进行统计联机分析处理(OLAP)查询的响应时间。
背景技术
所有的大型公司和企业在实施其商业行为的过程中每天都需要收集和累积大量的信息。一种普遍适用的解决方案是将这些信息以数据库的形式存储,最常见的是称作关系数据库的数据库模型。关系数据库实际上是一种在特定的关系数据库管理系统(RDBMS)的控制之下的表格的集合以及表格之间的定义关系,并且配备有结构化查询语言(SQL)以使得信息能够被有效地存储、更新和检索。也存在其他的模型例如层级模型。无论使用何种模型,在要存储和组织的总体数据量显著增加时都需要进一步地组织数据库的集合。实际上,现在很常见的是仅仅为了允许这些大型公司的日常操作就需要存储太字节(terabyte)(也就是1012字节)量级的信息数据,并且内容要做成持久保存和易于访问;因此,自从80年代以来就提出了数据仓库的概念。数据仓库和数据集市是由任何大型机构建立用于保存其战略经营和商业数据的储存库。组织仓库的方式跟商业智能有很大关系。为了允许任意地彻底分析其内容以使得尽管可能必须要涉及海量的数据但是所有仓库用户都能够做出知情决策,设计用于跟储存库之间来回地提取、转换和加载数据的仓库结构和工具以及检索信息的表达和报告是关键性的。
在旅游业中,这种需要存储和组织大量数据的大型机构通常是航空公司或GDS也就是“全球分销系统”。GDS是在全世界范围内支持包括航空公司、连锁酒店、租车公司、传统的旅行社、其他在线旅游服务提供商等在内的所有旅游业参与者的几家大型旅游服务提供商中的任何一家。这样的GDS例如是AMADEUS,这是一家总部在西班牙马德里的欧洲旅游服务提供商。GDS因此必须要从他们大量的存储资源、计算资源和网络资源中记录可能是数以百万计的游客、成千上万家旅行社和在线服务提供商以及数十家航空公司和运输公司的相关数据。为此,任何一家GDS都需要建立很多大型数据库来保存例如所支持的运输公司的所有日程表、他们提供的日常更新的各种费用以及数以百万计的游客的所有票据数据等内容。
例如航空公司或GDS等机构经常需要依赖于统计信息来确定其战略。统计信息也可以作为帮助终端用户购买的服务而被提供给终端用户。统计信息经常需要分析散布在构成某个机构(例如航空公司或GDS)的数据仓库的很多数据库中的海量数据。
然而,这种海量分散数据的分析并不是一项简单的工作。即使事实上数据库被专门设计为有助于检索数据,但是仓库的内容分析仍然隐含地表明来自不同数据库的可能会涉及很多大表的数据需要交叉比对,以使得能够响应于这样的查询而提取有意义的信息片段并将其提供给终端用户。通常,对于关系数据库而言,这就意味着要对表项执行联合运算。已知这些运算在处理资源和时间等方面都代价高昂。而且,从可能是独立的计算机化操作平台访问多个数据库将触发大量的I/O(输入/输出)操作,这跟如果能将处理限制在单一的内部计算机化单元内相比当然要慢得多。此外,所有这些操作都会影响到需要一直运行并且能够同时处理多名用户的仓库数据库的正常生产工作。这就使得难以甚至是无法实时处理(也就是在几毫秒到几十毫秒的期望时限内)涉及到获取大量信息(例如收集和计算日常统计数据)的复杂查询。
因此,本发明的目标是公开一种根据数据仓库保持更新的数据结构,并且其目的在于加快统计数据的检索以使得即使是复杂的查询,尽管可能会涉及到大量的数据,但是也能够实时地处理和响应。
本发明的更多目标、特征和优点将在本领域技术人员参照附图研读以下的说明内容之后变得显而易见。应该理解任何附加的优点均可并入本文。
发明内容
为了满足上述目标,本发明介绍了一种用于根据数据仓库提供统计数据的方法,数据仓库包括一种或多种数据存储装置以及耦合至数据存储装置的一个或多个处理器。
在下文中并且在附图简要说明之前提供了用于描述本发明的术语和参考词汇的名词解释。
所述方法的特征在于其包括以下步骤:
·定义多个索引域,每一个索引域都接受多个索引域值;
·建立多个索引文件并且将文件分层级地索引为索引树,其中对于每一棵树都包括以下步骤:
-分层级地排序索引域;
-定义分选仓,每一个分选仓都关联至一个索引域并且收集用于该索引域的一个或多个索引域值;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿玛得斯两合公司,未经阿玛得斯两合公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201280009577.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:印刷机
- 下一篇:一种基于热电半导体的导热系数自动测量设备