[发明专利]提高数据仓库性能的方法和装置有效
申请号: | 200780023779.7 | 申请日: | 2007-06-26 |
公开(公告)号: | CN101542478A | 公开(公告)日: | 2009-09-23 |
发明(设计)人: | 史提夫·拉夫达斯;道格·麦克道尔 | 申请(专利权)人: | 尼尔森(美国)有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京三友知识产权代理有限公司 | 代理人: | 黄纶伟 |
地址: | 美国伊*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 提高 数据仓库 性能 方法 装置 | ||
1.一种对从数据仓库所接收的数据进行格式化的方法,该方法包括 以下步骤:
接收分析指令;
基于所述分析指令从所述数据仓库检索数据;
将映射文件与事实表相关联,该映射文件存储在第一层级目录文件 路径中,所述事实表包括与维度表相关联的主关键字,该维度表与第二 层级目录文件路径中存储的维度映射文件相关联,所述维度表包括与存 储在第三层级目录文件路径中的数据文件相关联的维度关键字;以及
通过从所述第一层级目录文件路径到所述第二层级目录文件路径, 再到所述第三层级目录文件路径的顺序游历,来发起数据查询。
2.如权利要求1中所限定的方法,该方法还包括压缩所述第一层级 目录文件路径,所述第二层级目录文件路径和所述第三层级目录文件路 径。
3.如权利要求1中所限定的方法,该方法还包括基于存储在所述第 一层级目录文件路径中的所述映射文件来定位所述第二层级目录文件路 径。
4.如权利要求3中所限定的方法,该方法还包括基于存储在所述第 二层级目录文件路径中的映射文件来定位所述第三层级目录文件路径。
5.如权利要求4中所限定的方法,其中所述第三层级目录文件路径 包含与所述第一层级目录文件路径,所述第二层级目录文件路径和所述 第三层级目录文件路径相关联的查询数据。
6.如权利要求1中所限定的方法,该方法还包括基于所检索的数据 计算一次统计。
7.如权利要求6中所限定的方法,其中所述一次统计包括以下中至 少之一:执行一行为的实体的总数,在一位置执行该行为的实体的平均 数,或者在一时间段内执行该行为的实体的总数。
8.如权利要求7中所限定的方法,其中所述执行一行为的实体的总 数包括观看媒体节目的观众的总数。
9.如权利要求6中所限定的方法,该方法还包括至少基于所述一次 统计来计算二次统计。
10.如权利要求6中所限定的方法,该方法还包括至少基于所述一 次统计和所检索的数据来计算二次统计。
11.如权利要求1中所限定的方法,其中从所述数据仓库检索数据 的步骤包括以下步骤:在预定时间或周期性间隔中的至少之一期间处理 所述分析指令。
12.如权利要求1中所限定的方法,其中所述分析指令包括检索以 下至少之一的指令:收视成员媒体观看数据,广播节目收视率数据,或 人口统计收视率数据。
13.一种对从数据仓库接收的数据进行格式化的装置,该装置包括:
通信接口,其接收分析指令并与至少一个数据仓库以通信的方式连 接;
数据检索器,其从所述数据仓库检索数据,该数据检索器包括生成 查询请求的数据库查询引擎;
存储器,其存储所检索的数据;
数据格式器,其创建在所述存储器中存储的所述数据的层级目录文 件路径结构,该数据格式器创建与映射文件相关联的第一层级目录文件 路径,和与第二映射文件或数据文件中至少之一相关联的第二层级目录 文件路径;以及
分析器,其响应于查询,顺序地分别游历所述第一层级目录文件路 径和第二层级目录文件路径,以在存储于所述存储器中的所检索的数据 中识别各自的数据。
14.如权利要求13中所限定的装置,其中所述第一层级目录文件路 径包括与所述映射文件相关联的事实表路径。
15.如权利要求14中所限定的装置,其中所述第二层级目录文件路 径包括与所述第二映射文件或所述数据文件中至少之一相关联的维度表 路径。
16.如权利要求13中所限定的装置,该装置还包括压缩引擎,该压 缩引擎压缩所述第一层级目录文件路径和所述第二层级目录文件路径, 并且还压缩与所述第一层级目录文件路径和所述第二层级目录文件路径 相关联的所述映射文件或所述数据文件中的至少之一。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于尼尔森(美国)有限公司,未经尼尔森(美国)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200780023779.7/1.html,转载请声明来源钻瓜专利网。