[发明专利]业务智能系统的查询优化技术有效
申请号: | 201280029541.6 | 申请日: | 2012-06-05 |
公开(公告)号: | CN103608812B | 公开(公告)日: | 2017-05-10 |
发明(设计)人: | Y·(J)·王;M·杜米特鲁 | 申请(专利权)人: | 微软技术许可有限责任公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/20 |
代理公司: | 上海专利商标事务所有限公司31100 | 代理人: | 范玮 |
地址: | 美国华*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 业务 智能 系统 查询 优化 技术 | ||
背景
业务智能(BI)系统中所生成的典型查询要求要在某些维度属性的上下文中评估的某些测量的值。这些测量可包括例如销售总和、年累计销售、年增长率等,而维度属性可包括例如产品类别、财政年度、存储位置等。在事实表中不存在针对给定维度属性组合的记录的情况下,执行具有MOLAP(多维在线分析处理)类语义的BI查询会生成空测量值。例如,如果一月份没有销售空调,则针对产品=“空调”和月份=“一月”的“销售总和”测量会返回空值。对于这些查询的非常常见的过滤条件要求结果集中仅包括那些具有至少一个非空测量的行。例如,图1描绘了包括这样的过滤条件的查询100。具体而言,如图1所示,查询100包括要在一个或多个维度子查询104所指定的某些维度属性的上下文中评估的多个测量表达式1021-102n。具有过滤条件108的过滤器106被应用110于所评估的测量表达式,其中过滤条件106指定记录必须包含至少一个非空测量才能保持在结果集中。
执行诸如查询100之类的查询的一个直接策略是在当前维度上下文中计算每个测量的值,并且随后滤掉之后仅具有空测量值的行。这一单纯的方式可能非常慢,因为维度属性的组合产生相比于测量具有实值的子空间大得多的查询空间。例如,用户可能希望计算针对产品和顾客的交叉联接的年累计销售测量。因为典型的顾客只会购买所有可用产品中的小子集,所以为产品和顾客的每个组合计算年累计销售测量并且随后丢弃之后的空结果是极其低效的。
某些常规BI系统利用以事实为中心的建模。事实表和维度之间的联接类型在该模型中被设置。尽管这一模型的使用允许高效地处理仅关注事实表中现有记录的查询,但这使得难以回答诸如那些涉及时间序列计算之类的常见BI问题。这样的BI系统通常采取要求模型设计者引入附加的伪事实表的数据增密(densification)技术。
概述
提供本概述是为了以简化的形式介绍将在以下详细描述中进一步描述的选择的概念。本概述并不旨在标识所要求保护主题的关键特征或必要特征,也不旨在用于限制所要求保护主题的范围。此外,注意到本发明不限于在详细描述和/或本文的其它章节中所述的特定实施例。本文呈现这些实施例仅用于说明性的用途。基于本文所包含的描述,其它实施例对于相关领域的技术人员将是显而易见的。
本文描述了各种查询优化技术。这里被称为非空变换的第一种查询优化技术可被应用于指定一个或多个测量的查询、要在其中评估该一个或多个测量的维度上下文、以及指定要从结果集中排除仅具有空测量值的行的过滤条件。非空变换技术使得这样的查询能够被重写成对于宽泛的测量类别(这可被称为稀疏测量)的另一格式。与原始查询相比,新格式化的查询可被更高效地执行。
这里还描述了第二种查询优化技术。可被称为宏扩展的这一技术涉及重构查询的运算符树表示,以避免不必要的对扩展列的重复评估。
这里还描述了第三种查询优化技术。可被称为强度缩减的这一技术自动地选择具有用于实现两个表之间的联接的最低基数的最小数量的联接列。
下面将参考各个附图,详细描述本发明的进一步特点和优点,以及本发明的各实施例的结构和操作。值得注意的是,本发明不仅限于此处所描述的特定实施例。本文呈现这些实施例仅用于说明性的用途。基于本文所包含的描述,其它实施例对于相关领域的技术人员将是显而易见的。
附图说明
合并在此并作为说明书一部分的附图与说明书一起示出了本发明的实施例,且进一步用于解释本发明的原理的作用,并且使相关领域的技术人员能够实现并使用本发明。
图1描绘包括以下各项的查询:多个测量表达式,指定要在其中评估这些测量表达式的上下文的纬度子查询,以及指定记录必须包含至少一个非空的测量表达式才能保持在结果集中的过滤条件。
图2是根据一个或多个实施例的可实现一个或多个查询优化技术的系统的框图。
图3描绘根据一个实施例的可由查询处理器实现的过程流。
图4描绘根据一个实施例的按利用数据稀疏性的方式来构建查询的运算符树表示的方法的流程图。
图5示出根据一个实施例的宏扩展查询优化技术的示例。
图6示出根据一个实施例的非空变换查询优化技术如何将运算符树的标量子树转换成多个逻辑运算符树节点。
图7示出根据一个实施例的非空变换的最后阶段。
图8描绘进一步示出非空变换查询优化技术的方法的流程图。
图9示出根据一个实施例的用于执行强度缩减查询优化技术的方法的流程图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微软技术许可有限责任公司,未经微软技术许可有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201280029541.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种过电流保护装置
- 下一篇:交叉跨越隔离防护装置