[发明专利]使数据库查询形成聚类以用于运行时间预测有效
申请号: | 201510993945.2 | 申请日: | 2015-12-25 |
公开(公告)号: | CN105740312B | 公开(公告)日: | 2020-10-23 |
发明(设计)人: | I·贝勒吉提 | 申请(专利权)人: | 达索系统公司 |
主分类号: | G06F16/2453 | 分类号: | G06F16/2453;G06F16/28 |
代理公司: | 永新专利商标代理有限公司 72002 | 代理人: | 邬少俊;王英 |
地址: | 法国韦利济*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据库 查询 形成 用于 运行 时间 预测 | ||
本发明特别涉及一种计算机实现的用于使数据库中的参考查询形成聚类,从而基于目标查询与参考查询的相似度来预测数据库中的目标查询的运行时间的方法。所述方法包括以下的步骤:提供(S10)表示参考查询的运行时间的多个数值;针对预先确定的聚类的数量,计算数值的最佳K均值聚类形成,其中,计算步骤(S20)包括将应用至其阶数等于所述数值的数量的方块矩阵的线性时间行最小值搜索算法迭代与预先确定的聚类的数量相对应的次数;并且根据计算的所述数值的聚类形成而使参考查询形成聚类。这种方法改进了数据库查询时间预测的领域。
技术领域
本发明特别地涉及数据库工程的领域,并且尤其涉及计算机实现的用于使数据库中的参考查询形成聚类的方法、计算机程序、和系统。
背景技术
数据库工程常常包含关于对数据库的查询的不同种类的优化,并且尤其针对执行工作量预测。执行查询所花费的时间被称为工作量,或简单地称为执行时间、或查询运行时间。这通常是优化器将最小化的量,即使常常必须考虑其他成本,如所使用的存储器空间和资源。重要的是要注意到,回答查询所需要的时间是用于计算查询计划与用于执行查询计划的时间的和。一些技术倾向于寻找这两个量之间的权衡(例如,在文档US20050071331A1中)。
查询运行时间预测的最重要的应用是查询优化,所述查询优化依靠这些预测以从常常很大数量的候选者中选择特定的执行计划。在现实世界的应用中,数据库系统在必须一些时间内回答很多查询,这就是为什么其运行查询调度(详见文章“Distribution-BasedQuery Scheduling”,作者Chi,Hacigum,Hsiung,Naughton,2013),该调度基于不同的标准,如期望的查询运行时间、从其发送查询的用户的优先级、有关的任务的优先级。
因此,查询运行时间是需要进行估计以便调度查询的中央信息。特别地,本领域技术人员想要避免可能延迟其他重要的查询的瓶颈查询。此外,评估查询的运行时间以便量化对其计算投入(put)多少资源以使得查询将在给定的时间限制之前被执行,可以是有趣的。这在文档US20050192937中进行了说明。如所提及的,预测查询的运行时间是查询调度的核心,并且因此该问题已经被集中地研究过。
一种用于预测查询的运行时间的自然的方式是去寻找已经被执行的查询(并且对于那些已经存储了所使用的时间的查询)的“相似”查询的运行时间。为了实现这种方法,必须要找到好的表示以便利用例如在文章“Predicting Multiple Metrics for Queries:Better Decisions Enabled by Machine Learning”,作者Ganapathi,Kuno,Dayal,Wiener,Fox,Jordan,和Patterson(2009)中的度量,或文章“Learning to PredictResponse Times for Online Query Scheduling”,作者Macdonald,Tonellotto,和Onnis(2011)中的模型选择,来将好的表示之间的查询进行比较,并且学习如何对其运行时间建模。对查询的表示的选择和根据该表示对运行时间进行建模的方法取决于构建查询的语言。例如,研究报告“Predicting SPARQL Query Execution Time and Suggesting SPARQLQueries Based on Query History”,作者Hasan和Gandon处理SPARQL语言的情况。
接着可以在机器学习算法已经被应用到训练集之后,评估对查询的运行时间的预测。特别地,论文“Dynamic Cost Models for Query Runtime Prediction”作者Lima分析了如PostgreSQL的关系数据库的情况,并且利用特定的查询的表示来测试不同的经典机器学习算法。有监督的平均、有监督的线性回归、有监督的K近邻回归、有监督的Nadaraya-Watson回归都是常用的概念。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于达索系统公司,未经达索系统公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510993945.2/2.html,转载请声明来源钻瓜专利网。