[发明专利]使数据库查询形成聚类以用于运行时间预测有效
申请号: | 201510993945.2 | 申请日: | 2015-12-25 |
公开(公告)号: | CN105740312B | 公开(公告)日: | 2020-10-23 |
发明(设计)人: | I·贝勒吉提 | 申请(专利权)人: | 达索系统公司 |
主分类号: | G06F16/2453 | 分类号: | G06F16/2453;G06F16/28 |
代理公司: | 永新专利商标代理有限公司 72002 | 代理人: | 邬少俊;王英 |
地址: | 法国韦利济*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据库 查询 形成 用于 运行 时间 预测 | ||
1.一种计算机实现的使数据库中的参考查询形成聚类以用于基于所述数据库中的目标查询与所述参考查询的相似度来对所述目标查询的运行时间进行预测的方法,其中,所述方法包括以下的步骤:
提供(S10)表示所述参考查询的所述运行时间的多个n个数值x1,...,xn;针对预先确定的聚类的数量K个,计算(S20)所述数值的最佳K均值聚类形成,其中,所述计算步骤(S20)包括将应用至具有等于所述数值的数量的阶数n的方块矩阵H的线性时间行最小值搜索算法迭代与所述预先确定的聚类的数量相对应的次数;并且
根据所述数值的所计算的聚类形成,使所述参考查询形成聚类(S30),其中,所述数值x1,...,xn被进行排序并相应地被编制了索引,并且所述计算步骤(S20)内的所述迭代包括,在每个相应的迭代等级k并且对于低于所述数值的数量n的每个相应的索引j,最小总失真TDmin(j,k)的计算对于所编制的索引小于该相应的索引的数值xi,i≤j,的子集是能够实现的,其中根据应用至所述方块矩阵H的所述线性时间行最小值搜索算法,聚类的数量对应于相应的迭代等级k,并且其中,在每个相应的迭代等级k并且对于低于所述数值的数量n的每个相应的索引j,对于每个行索引i和每个列索引j,矩阵条目H(i,j)对应于以下项的和:
在针对该个行索引之前的索引i-1的先前的迭代中计算的最小总失真TDmin(i-1,k-1),以及
在该个行索引和该个列索引之间的所述数值的连续的子集xi,...,xj的失真disto(i,j)。
2.根据权利要求1所述的方法,其中,所述方法还包括,在每个相应的迭代等级k,存储由所述行最小值搜索算法返回的索引Cutmin(j,k)。
3.根据权利要求2所述的方法,其中,所述方法还包括,在所述计算步骤(S20),从所存储的索引确定最佳聚类形成。
4.根据权利要求3所述的方法,其中,从所存储的索引确定所述最佳聚类形成包括:从所存储的索引Cutmin中的最后被索引的数值Cutmin(n,K)开始迭代地将所述数值进行划分,其中,在每个相应的迭代等级q,针对等于当前形成的聚类的所述最后被索引的数值的索引的所述行索引,所述当前形成的聚类的起始数值的索引等于在所述计算步骤(S20)内的迭代期间在等级K-q的迭代处所存储的索引,K-q等于所述预先确定的聚类的数量减去该相应的迭代等级q。
5.一种用于预测数据库中的目标查询的运行时间的方法,其中,所述方法包括:
提供能够通过权利要求1-4中的任何一项所述的方法获得的所述数据库中的参考查询的聚类形成,并且提供所述参考查询的运行时间;
基于所述目标查询与所述参考查询的相似度而将所述目标查询与所述聚类形成的聚类相关联;并且
根据与所述目标查询相关联的所述聚类的所述参考查询的运行时间,预测所述目标查询的运行时间。
6.一种数据存储介质,其上存储有计算机程序,其包括用于执行权利要求1-5中的任何一项所述的方法的指令。
7.一种系统,其包括耦合至存储器的处理器,所述存储器上记录有权利要求6所述的计算机程序。
8.根据权利要求7所述的系统,其中,所述存储器还存储数据库,所述系统被配置用于对所述数据库中的参考查询和/或对所述数据库中的目标查询执行所述程序。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于达索系统公司,未经达索系统公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510993945.2/1.html,转载请声明来源钻瓜专利网。