[发明专利]利用综合操作的聚合数据有效

专利信息
申请号: 200680023382.3 申请日: 2006-06-22
公开(公告)号: CN101208696A 公开(公告)日: 2008-06-25
发明(设计)人: 克雷格·W.·斯坦菲尔;马歇尔·A.·伊斯曼 申请(专利权)人: 起元软件有限公司
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 隆天国际知识产权代理有限公司 代理人: 郑小军;郑特强
地址: 美国马*** 国省代码: 美国;US
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 利用 综合 操作 聚合 数据
【说明书】:

技术领域

发明涉及利用综合操作的聚合数据。

背景技术

存在多种联机分析处理(OLAP)技术,其允许用户分析存储在数据库中的多维数据。典型地,该数据库包括具有多个维度(或“关键字字段”)和多个属性(或“非关键字字段”)的“事实表”,其中维度存储用作进入多维数据的索引的值、属性存储其它值。用户可以执行涉及计算多维数据聚合的数据查询。为了增加此种查询的效率,典型的OLAP方案预先计算一些可能的聚合。

发明内容

在总的方面,本发明特征在于一种用于聚合数据的方法以及相应的软件和系统。该方法包括接受第一数据集,该第一数据集包括多个记录,每个记录保存(holding)多个字段中每一个字段的值。从该第一数据集产生第二数据集,该第二数据集包括一个或多个聚合记录。该第二数据集的每个聚合记录对应于来自该第一数据集的一个或多个记录,且上述被该第二数据集的每个聚合记录所对应的来自该第一数据集的一个或多个记录匹配于与该聚合记录相关联的字段子集中的值。从该第二数据集产生第三数据集,该第三数据集包括一个或多个聚合记录。该第三数据集的每个聚合记录对应于该第一数据集的一个或多个聚合记录,且上述被该第三数据集的每个聚合记录所对应的该第一数据集的一个或多个聚合记录匹配于与该第三数据集的聚合记录相关联的字段子集中的值。与第三数据集中的聚合记录相关联的聚合值表示对与来自该第一数据集的多个记录相关联的值执行不可级联操作的结果。

这个方面可包括一个或多个以下特征。  

对与来自该第一数据集的多个记录相关联的值执行不可级联操作是由以下各项组成的群组中之一:确定所述值中不同值(distinct value)的个数确定所述值的中间值,确定所述值的多个极值的和,以及确定所述值的多个和的极值。

该不可级联操作是这样的,对一组操作数执行该不可级联操作的结果不能分解成以下的操作执行结果:对该操作数的第一子集执行该操作的第一结果,和对该操作数的第二子集执行该操作的第二结果;其中第一子集和第二子集是互斥的和穷举的。

所述多个字段中的至少一个字段至少部分地与所述多个字段中的另一个字段函数相关。

与所述多个字段中至少一个字段相关联的至少一些值依赖于与所述多个字段中另一个字段相关联的对应值。

从该第二数据集产生该第三数据集包括接收该第二数据集的聚合记录流。

在另一总的方面,本发明特征在于一种用于聚合包括多个记录的数据的方法,每个记录保存多个字段中每一个字段的值。该方法包括,在考虑所述字段之间的函数相关性的条件下,利用不可级联操作执行在所述记录内字段的多级聚合。

这个方面可包括一个或多个以下特征。

该不可级联操作是由以下各项组成的群组中之一:确定所述值中不同值的个数,确定所述值的中间值,确定所述值的多个极值的和,以及确定所述值的多个和的极值。

该不可级联操作是这样的,对一组操作数执行该不可级联操作的结果不能分解成以下的操作执行结果:对该操作数的第一子集执行该操作的第一结果,和对该操作数的第二子集执行该操作的第二个结果;其中第一子集和第二子集是互斥的和穷举的。

在另一总的方面,本发明特征在于一种用于聚合数据的方法以及相应的软件和系统。该方法包括接受第一数据集,该第一数据集包括多个记录,每个记录保存多个字段中每一个字段的值。该方法包括产生该第一数据集的记录与多个第一关键字集(key set)的笛卡尔积。每个关键字集表示该第一数据集的字段子集。该方法包括从所产生的笛卡尔积产生第二数据集,该第二数据集包括一个或多个聚合记录,每个聚合记录对应于来自该第一数据集的一个或多个记录,上述被每个聚合记录所对应的来自该第一数据集的一个或多个记录匹配于与该聚合记录相关联的字段子集中的值。该方法包括从该第二数据集产生第三数据集,该第三数据集包括一个或多个聚合记录,该第三数据集的每个聚合记录对应于该第一数据集的一个或多个聚合记录,上述被该第三数据集的每个聚合记录所对应的该第一数据集的一个或多个聚合记录匹配于与该第三数据集的聚合记录相关联的字段子集中的值。

这个方面可包括一个或多个以下特征。

产生该第三数据集包括对所产生的笛卡尔积和如下数据集执行连接操作,该数据集的记录包含表示所述多个第一关键字集中之一的第一值和表示多个第二关键字集中之一的第二值,所述多个第二关键字集中的每一个表示该第二数据集的字段子集;其中该连接操作通过匹配关键字集来连接记录。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于起元软件有限公司,未经起元软件有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/200680023382.3/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top