[发明专利]用于大数据管理系统的最优压力测试的工作负载生成在审
申请号: | 202211152480.4 | 申请日: | 2022-09-21 |
公开(公告)号: | CN115934502A | 公开(公告)日: | 2023-04-07 |
发明(设计)人: | I.恩德;A.克利福德;P.M.巴巴斯;M.E.德派瓦费尔南德斯马蒂亚斯;H.A.巴蒂亚 | 申请(专利权)人: | 国际商业机器公司 |
主分类号: | G06F11/36 | 分类号: | G06F11/36;G06F16/9532;G06F11/26 |
代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 陈金林 |
地址: | 美国纽*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 数据管理 系统 最优 压力 测试 工作 负载 生成 | ||
1.一种用于对大数据管理系统最优地执行压力测试的计算机实现的方法,所述方法包括:
生成随机测试查询的集合;
编译所述随机测试查询的集合以提取访问计划特性以确定所述随机测试查询的集合的特征的数据点;
测量所述随机测试查询的集合的特征的所述数据点和与提取的特征集合中的每个相同特征相对应的数据点的分布的平均值之间的距离;
对其距离超过阈值距离的每个随机测试查询进行排名;
按照排名顺序执行排名的随机测试查询;
在日志中添加那些导致错误的所执行的排名的随机测试查询;以及
基于所述日志标识执行针对大数据管理系统的压力测试的查询。
2.根据权利要求1所述的方法,其中,基于预期运行时持续时间对其距离超过所述阈值距离的所述随机测试查询中的每一个进行排名。
3.根据权利要求2所述的方法,其中,所述运行时持续时间使用决策树预测,其中所述决策树包括变量,其中所述变量的元素包括特征。
4.根据权利要求3所述的方法,其中,所述变量包括选自包括以下各项的组中的查询的一个或多个特性:表类型、操作符、中断、列类型和表元数据。
5.根据权利要求1所述的方法,其中,基于分配给其距离超过所述阈值距离的所述随机测试查询中的每一个的权重,对其距离超过所述阈值距离的所述随机测试查询中的每一个进行排名,其中,通过线性系统的解确定所述权重。
6.根据权利要求1所述的方法,进一步包括:
标识与从训练工作负载的成功查询提取的特征相对应的数据点;
从与所述提取的特征中的每个特征相对应的标识的数据点确定数据点的分布的平均值;
接收测试套件的查询;
编译接收到的所述测试套件的查询以提取访问计划特性以确定特征的数据点;
测量所述测试套件的编译的查询的每个特征的所述数据点与来自与每个这样的特征相对应的标识的数据点的数据点的所述分布的所述平均值之间的距离;以及
将与所述测试套件的编译的查询的特征相对应的数据点和所述特征的数据点的所述分布的所述平均值之间的最远距离设置为所述特征的阈值距离。
7.根据权利要求6所述的方法,其中,所述距离包括马哈拉诺比斯距离。
8.一种用于针对大数据管理系统最优地执行压力测试的计算机程序产品,所述计算机程序产品包括具有其中体现的程序代码的一个或多个计算机可读存储介质,所述程序代码包括用于执行权利要求1至7中任一项所述的方法的任何步骤的程序指令。
9.一种系统,包括:
存储器,用于存储计算机程序,所述计算机程序用于针对大数据管理系统最优地执行压力测试;以及
处理器,连接至所述存储器,其中,所述处理器被配置为执行所述计算机程序的程序指令以执行权利要求1至7中任一项所述的方法的任何步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国际商业机器公司,未经国际商业机器公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211152480.4/1.html,转载请声明来源钻瓜专利网。