[发明专利]一种数据仓库中基于连接索引的查询优化方法有效

专利信息
申请号: 201510303412.7 申请日: 2015-06-05
公开(公告)号: CN104866608B 公开(公告)日: 2018-01-09
发明(设计)人: 张延松;张宇;王珊 申请(专利权)人: 中国人民大学
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 北京纪凯知识产权代理有限公司11245 代理人: 徐宁,孙楠
地址: 100872 北京市海淀区中关*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 数据仓库 基于 连接 索引 查询 优化 方法
【权利要求书】:

1.一种数据仓库中基于连接索引的查询优化方法,其特征在于:所述查询优化方法包括以下步骤:

1)创建基于维表代理键的事实表外键连接索引;

当维表采用列存储或定长记录的行存储时,维表代理键直接映射为维表记录的偏移地址,事实表外键列的值直接映射为维表记录偏移地址,实现基于连接索引的查询处理;

2)创建连接索引更新策略:当维表中插入新记录时,自动为其分配新的代理键值;代理键不包含语义,记录的更新操作只修改语义属性值,不对代理键进行修改;数据仓库中被参照的表中记录的删除需要满足参照表中相应记录首先被删除的条件;

3)当维表上存在谓词条件时,通过连接索引直接访问维表记录后需要进行谓词判断,参照位图连接索引通过动态位图连接索引计算生成连接位图索引,优化事实表扫描性能;

4)在数据仓库中,当维表上的选择率低于1/512时,维表位图进一步压缩以提高维表位图计算的cache层次;

5)采用基于协处理器内存计算的参照位图连接索引计算方法,只使用数组和位图数据结构,计算简单的内存地址访问,能够在众核协处理器上完成计算过程。

2.如权利要求1所述的一种数据仓库中基于连接索引的查询优化方法,其特征在于:所述步骤1)中,创建连接索引包括以下几种策略:

(1)当维表使用代理键作为主键时,事实表外键直接作为连接索引;

(2)当维表主键不是代理键但能函数映射为代理键时,通过函数映射实现连接索引;

(3)当维表主键是复合主键或不能函数映射为代理键的主键时,通过主-外键同步更新或增加代理键外键的方法创建连接索引;

(4)事实表与维表之间,以及雪花模型中维表之间基于代理键参照引用的外键机制使外键作为连接索引使用,优化表间连接操作。

3.如权利要求1所述的一种数据仓库中基于连接索引的查询优化方法,其特征在于:所述步骤2)中,当维表记录需要删除时,需要保证代理键的顺序性,采用两种更新策略:

(1)设置一个删除向量D_Vec,存储删除的维表记录的代理键值,保留当前删除记录的存储空间;当插入新记录时,为新记录分配删除向量中的代理键值,将新插入的记录写入删除记录代理键对应的存储空间,填补删除记录留下的记录空洞;

(2)通过记录交换实现记录删除:当维表记录删除后,将维表中最后一条记录置换到当前删除记录的位置,代理键更新为当前位置的代理键值,同时需要在事实表中将交换的维表记录对应的外键更新为置换后的代理键。

4.如权利要求1所述的一种数据仓库中基于连接索引的查询优化方法,其特征在于:所述步骤3)中,参照位图连接索引的计算过程分为以下几个步骤:

(1)根据查询谓词生成维表位图,将SQL命令分解为在各个维表上的选择子句,根据维表过滤条件创建维表位图,事实表外键按维表位图的大小和选择率优先执行与小的、低选择率的维表位图上进行的参照位图连接索引计算;

(2)通过事实表外键连接索引映射到维表位图,根据维表位图映射位置的取值生成连接位图,连接位图中满足维表查询条件的位置设置为1,否则置为0;

(3)按照连接位图中1的位置访问下一个事实表外键对应的偏移地址,将其对应的值映射到下一个维表位图的位置,根据维表位图该位置的值更新连接位图对应的位置的取值;依次处理完各个事实表外键列后生成查询最终的连接位图,即连接位图通过事实表外键参照维表位图而动态生成。

5.如权利要求1所述的一种数据仓库中基于连接索引的查询优化方法,其特征在于:所述步骤4)中,将原始维表位图中连续的512位映射为一个二级位图位,小的二级位图比原始的维表位图具有更高的cache访问性能;二级位图机制对应低选择率查询,当查询选择率低于0.195%时能将大量的维表位图内存访问优化为对小的二级位图的cache访问。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民大学,未经中国人民大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201510303412.7/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top