[发明专利]一种基于改进型SDD-1算法的数据库多连接查询优化方法无效
申请号: | 201110043615.9 | 申请日: | 2011-02-24 |
公开(公告)号: | CN102110158A | 公开(公告)日: | 2011-06-29 |
发明(设计)人: | 万旺根;周演飞;余小清 | 申请(专利权)人: | 上海大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 上海上大专利事务所(普通合伙) 31205 | 代理人: | 何文欣 |
地址: | 200444*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 改进型 sdd 算法 数据库 连接 查询 优化 方法 | ||
技术领域
本发明专利涉及一种基于改进型SDD-1(System for Distributed Database,分布式数据库系统)算法的数据库多连接查询优化方法,主要是针对分布式数据库中的多连接查询中的连接执行策略的优化问题,旨在保证得到一个较优的查询执行计划,从而大大较少查询尤其是大规模多连接查询的执行时间。
背景技术
如今,由于计算机的应用领域迅速扩大,数据库的规模也日益增长,用户查询越来越复杂。于是,人们在集中式数据库系统成熟技术的基础上产生和发展了分布式数据库系统。分布式数据库系统是数据库技术和网络技术两者相互渗透和有机结合的结果。分布式数据库系统中的数据在逻辑上属于同一个系统,而在物理上却分布在计算机网络的不同结点上,并由一个分布式数据库管理系统统一管理。
数据库查询是数据库的核心操作,数据库管理系统只需要用户提出“查什么”,而不需要用户解决“怎么查”,即指定具体的查询策略。在实际中,我们不仅要利用数据库管理系统根据SQL(Structure Query Language,结构化查询语言)指令准确查询用户需要的数据,还需要充分考虑其查询效率的高低。因此,查询效率是数据库管理系统必须面临的一大挑战。于是,相应的查询优化技术便成了计算机技术最活跃的研究领域之一。在集中式数据库中,执行查询的开销主要是数据的输入和输出以及中央处理器运算时产生的代价。分布式数据库系统是在集中式数据库系统技术的基础上发展起来的,除了数据的逻辑独立性与物理独立性外,还有数据分布独立性,也被称为分布透明性。分布透明性指的是用户不必关心数据的逻辑分片,不必关心数据物理位置分布的细节,也不必关心重复副本(冗余数据)一致性问题,同时也不必关心局部场地上数据库支持那种数据模型。
对用户来说,虽然使用分布式数据库系统与使用集中式数据库系统感觉上一样,好像所有数据都存储在自己使用的那台计算机中,但是,数据的分散存储使得查询处理中需要它们在站点间相互传递,而数据在网络上传输要花费很大的代价。因此,影响分布式查询优化性能不仅包括CPU(Central Processing Unit)、I/O(Input/Output)等在内的局部开销,更重要的是查询数据在站点间传输时的通信费用。而分布式数据库查询处理和优化不仅是影响分布式数据库管理系统性能的关键因素,而且还对整个应用系统数据的可用性、可扩展性、提高分布式数据库的使用效率和可靠性起着不可估量的作用。
实验结果表明,通过本发明专利优化后的分布式查询代价(主要是关系间的连接代价)比运用传统启发式优化方法所产生的代价更小。因此,本发明专利具有一定的实用价值。
发明内容
本发明专利的目的在于针对已有技术中存在的缺陷,提供一种基于改进型SDD-1算法的数据库多连接查询优化方法,通过遗传算法的全局搜索能力,对SDD-1算法得到的执行结果进行优化,并最终求得比较理想的结果。
为达到上述目的的构思为:首先执行改进的SDD-1算法,利用该算法得到一个查询执行策略集,将该执行策略集作为遗传算法的初始种群产生的依据。然后,执行遗传算法,利用遗传算法的全局搜索能力对SDD-1算法得到的结果进行优化。最终,得到一个比较理想的查询执行策略。
根据上述发明构思,本发明专利采用的技术方案进一步完善为:首先构造一个查询图 ,然后循环运行SDD-1算法次。每次运行中,先计算查询图中所有双向半连接的收益。找出其中净收益最大的双向半连接操作,这里净收益值定为。将净收益值属于范围内的所有双向半连接操作归并为一个集合,以蒙特卡罗选择策略从集合中选择一个元素,其中,为收益阈值。如此重复,直到查询图上不存在双向半连接。由此,就得到了一个查询执行策略。重复执行SDD-1算法到指定次数,我们就能得到个不同的执行策略。将SDD-1算法运行得到的查询执行策略集作为遗传算法的输入。经过遗传算法优化后,得到最终的查询执行策略。该方法具体包括如下步骤:
1)、设置初始参数:包括对SDD-1算法初始参数的设置和对遗传算法初始参数的设置;
2)、获取查询执行策略集:从构建的查询图中寻找有益双向半连接,并从有益双向半连接候选集中选择有益双向半连接到有益双向半连接集合中,重复以上步骤,直到查询图中不存在有益双向半连接,将所得有益双向半连接集合的值添加到执行策略集合中,重复以上步骤,直到运行次数达到;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海大学,未经上海大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110043615.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种复合消毒液及制备方法
- 下一篇:一种肥猪的饲喂方法