[发明专利]一种面向复杂数据仓库环境的优化策略自动生成方法无效

专利信息
申请号: 200910083489.2 申请日: 2009-05-06
公开(公告)号: CN101556604A 公开(公告)日: 2009-10-14
发明(设计)人: 隋琪;王腾蛟;杨冬青 申请(专利权)人: 北京大学
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 北京路浩知识产权代理有限公司 代理人: 胡小永
地址: 100871*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 面向 复杂 数据仓库 环境 优化 策略 自动 生成 方法
【权利要求书】:

1.一种面向数据仓库环境的优化策略自动生成方法,其特征在于,包括如下步骤:

(1)生成诊断点图,诊断点图根据诊断点的语义链接组成,每个诊断点都会链接到数据仓库语义库,数据仓库语义库用来描述数据仓库各个组成要素之间的关系;

(2)根据诊断点距离 升序排列所有诊断点DGNj,诊断点距离就是诊断点对应的数据仓库语义库中元素之间的距离;

(3)对每个处于诊断点重心的单元DGNj,按下述方式处理:

(3-1)在调优过程中加入新结点;

(3-2)按诊断点距离从大到小广度优先遍历DGNj,直到语义距离小于某个限定值Dismax

(3-3)若新的结点不在调优过程中,则加入该新的结点;

(4)对于诊断过程中的每个诊断点,检查该诊断点,如果此诊断点异常,则使用相应的调优策略;

(5)输出调优过程;其中,

所述诊断点DGNj是一个包含名称、对应策略和语义指针的三元组,诊断点是可能导致系统瓶颈的可疑点,名称就是诊断点的名称,对应策略是这个诊断点出现异常的时候的相应调优策略,语义指针是一个指向数据仓库系统语义库的指针,该语义指针所指向的语义用来表示该诊断点在整个数据仓库系统中的含义和作用,所述数据仓库系统语义库用于描述整个数据仓库系统中的概念及其相互关系,且每一个诊断点都含有一组不同的需求回报分数向量;

所述调优过程是一个诊断点组成的序列【DGN1,DGN2,......DGNn】,使用不同的顺序检查这些诊断点后,不同的调优过程在语义库的支持下自动生成; 

两个诊断点DGNa和DGNb之间的语义距离用SemanticDis(DGNa,DGNb)表示,即语义指针指向的数据仓库系统语义库元素之间的最短距离;

需求回报函数用下式来定义: d代表了预先定义的需求回报的需求回报维数,pi是对第i维需求回报的权重,si是在一个诊断点中第i维的需求回报分数,该分数表示这个诊断点对整个数据仓库系统性能的重要程度;

所述诊断点图是一个无向图G=(V,E),V是一组诊断点,E是一组连接两个诊断点DGNi和DGNj的边,它可以表示两个单元的语义距离;

所述诊断点距离,用下式定义:

如果DGNi和DGNj邻接,那么二者的距离则是,

Dis(DGNi,DGNj)=SemanticDis(DGNi,DGNj)*(Ri+Rj)

诊断点重心DGNcenter是诊断点图的一个顶点,定义如下:

该式表示诊断点重心是诊断点图中与其他所有诊断点距离之和最小的诊断点。

2.一种利用如权利要求1所述方法生成的优化策略对数据仓库环境进行优化的方法。 

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京大学,未经北京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/200910083489.2/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top