[发明专利]一种基于进化算法的数据库多连接查询优化方法在审

专利信息
申请号: 201710700285.3 申请日: 2017-08-16
公开(公告)号: CN107463702A 公开(公告)日: 2017-12-12
发明(设计)人: 孙治;秦小林;张力戈;王文彬;王会勇 申请(专利权)人: 中科院成都信息技术股份有限公司
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 成都九鼎天元知识产权代理有限公司51214 代理人: 邓世燕
地址: 610041 四川省成都市高新*** 国省代码: 四川;51
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 进化 算法 数据库 连接 查询 优化 方法
【说明书】:

技术领域

发明属于计算机信息技术应用领域,具体涉及分布式数据库的连接执行策略的优化,可用于优化分布式数据库的连接执行策略,减少大规模多连接查询的执行时间。

背景技术

随着传统的数据库技术日趋成熟、计算机网络技术的飞速发展和应用范围的扩大,以分布式为主要特征的数据库系统的研究与开发受到人们的高度关注。而多关系连接查询作为分布式数据库中的重要操作,是查询优化中需要突破的一个难点。分布式查询处理具有能够通过通信网络存取远程站点的数据,以及在不同站点间传输请求和数据的能力。分布式查询优化的准则是使通信费用最低和响应时间最短,即以最小的总代价,在最短的响应时间内获得需要的数据。为了执行全局查询和确定一个好的查询策略,首先需进行查询分解,然后再确定操作执行的次序,最后确定操作的执行方法,其中关键是确定操作执行的次序,即主要是确定连接操作的顺序。

SDD-1算法是一种在传统分布式关系型数据库中广泛应用的查询方法。在查询涉及到的关系数较少时,该算法在查询计划的生成时间和查询的通信费用方面都有着其它算法无法比拟的优越性。但是由于SDD-1算法本身的局限性,在求解最优查询计划时,它容易陷入局部最优解。而涉及到的关系数目增多时,其生成查询计划的时间会迅速上升,甚至有可能超出系统的承受能力。遗传算法和蚁群算法都是启发式寻优方法,常被应用到解决各种优化问题。在搜索最优解的过程中,遗传算法的前期搜索速度快且可潜在并行,具有较强的全局搜索能力。而蚁群算法后期搜索速度快且充分使用了信息的正反馈,具有较强的局部搜索能力。

因此,针对以上问题,有必要提出一种新的基于进化计算的优化方法,解决SDD-1算法在生成查询计划时容易陷入局部最优解的缺陷,显著降低查询计划的生成时间,提高连接查询的查询效率。该方法将并行遗传算法和多蚁群算法进行了融合。在普通蚁群基础上引入多蚁群概念,降低算法陷入局部最优的概率,提高算法寻优的能力利用并行遗传算法来突破多蚁群算法前期搜索的盲目,并结合多蚁群算法的优秀寻优能力,最终达到提高查询效率的目的。

发明内容

为了克服现有技术的上述缺点,本发明提供了一种基于进化算法的数据库多连接查询优化方法,通过并行遗传算法的全局搜索能力和多蚁群算法的局部搜索能力,对SDD-1算法容易陷入局部最优解的问题进行了优化,输出了规约最优的查询执行策略,最终达到提高查询效率的目的。

本发明解决其技术问题所采用的技术方案是:一种基于进化算法的数据库多连接查询优化方法,包括如下步骤:

步骤一、对原始数据进行预处理,构建出查询图G;

步骤二、获取有益双向半连接集合BS;

步骤三、构建并行遗传算法的初始种群;

步骤四、执行并行遗传算法,得到规约最优查询路径;

步骤五、构建多个蚁群的初始种群;

步骤六、执行多蚁群算法;

步骤七、输出最终的查询执行策略。

与现有技术相比,本发明的积极效果是:

本发明首先将数据预处理和双向半连接两种技术引入到SDD-1算法中,采用投影等一元操作精简数据,同时还对各节点的数据进行了归并排序,而双向半连接技术可以对行和列的数据同时进行缩减。然后计算出全部有益双向半连接加入到集合BS中,采用并行遗传算法求解SDD-1算法的连接查询策略,构造了适用于该问题的群体初始化方法、适应度函数和相关遗传算子,得到了求解该问题的规约最优查询路径。最后用该查询路径对蚁群算法的信息素矩阵进行初始化,利用多蚁群优化方法再次求出最优查询路径,解决了并行遗传算法局部搜索能力弱的问题。

本发明充分考虑了数据连接查询时需进行的数据传输和归并排序操作的特性,采用双半连接技术和数据归并排序预处理技术,进而加快查询处理速度。传统的SDD-1算法采用爬山法寻找最优查询执行策略,存在两点不足:容易陷入局部最优和查询计划生成时间随着关系数目成指数增长。针对上述不足,本发明将并行遗传算法和多蚁群算法进行了融合。并行遗传算法具有较好的全局搜索能力,并行执行可以大大缩短搜索时间。多蚁群算法可以降低算法陷入局部最优的概率,提高算法寻优的能力利用并行遗传算法来突破多蚁群算法前期搜索的盲目,并结合多蚁群算法的优秀寻优能力,最终达到提高查询效率的目的。该多连接查询优化方法在实际应用中可以制定出更优的查询执行策略,从而减少多表连接时的查询响应时间。

附图说明

本发明将通过例子并参照附图的方式说明,其中:

图1为本发明方法的流程图。

具体实施方式

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中科院成都信息技术股份有限公司,未经中科院成都信息技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201710700285.3/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top