[发明专利]面向动态负载场景的大数据系统跨层配置参数协同调优方法和系统在审

专利信息
申请号: 202110313931.7 申请日: 2021-03-24
公开(公告)号: CN113032367A 公开(公告)日: 2021-06-25
发明(设计)人: 窦晖;贾成成;张以文 申请(专利权)人: 安徽大学
主分类号: G06F16/21 分类号: G06F16/21;G06F9/50;G06F16/27;G06N3/00
代理公司: 合肥市浩智运专利代理事务所(普通合伙) 34124 代理人: 张景云
地址: 230039 *** 国省代码: 安徽;34
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 面向 动态 负载 场景 数据 系统 配置 参数 协同 方法
【权利要求书】:

1.面向动态负载场景的大数据系统跨层配置参数协同调优方法,其特征在于,包括以下步骤:

S1:对数据存储层、资源调度层、数据处理层中各软件进行参数重要性排序,选取前设定维参数;对提取的前设定维参数进行随机取值,生成多组配置;

S2:将多组配置带入大数据系统执行,生成特定配置下的性能标签,最后得到配置性能矩阵;

S3:使用配置性能矩阵利用随机森林建立性能模型,并存储目标性能模型用以新工作负载进行模型的迁移;

S4:将目标性能模型带入遗传算法,由遗传算法找出该工作负载下数据存储层、资源调度层、数据处理层中软件协同令系统整体性能表现最好的一套配置参数;

S5:当新的工作负载到来时,计算当前新工作负载与原有各工作负载的相似度,根据相似度计算结果,出现以下两种情况:

(1)若相似度取最大值且大于阈值,则认为新工作负载与该原有工作负载相似,将该原有工作负载的性能模型通过一定的补偿机制迁移为当前新工作负载的性能模型,然后使用遗传算法在性能模型上搜寻当前新工作负载的最优配置;

(2)若相似度未达到阈值,则认为当前新工作负载为未记录的新类型负载,则采用贝叶斯优化在线对所述设定维参数进行选取,找到符合要求的配置令当前新类型负载执行,同时对该新类型负载执行步骤S1-S4,当找到最优配置时,使用最优配置执行。

2.根据权利要求1所述的面向动态负载场景的大数据系统跨层配置参数协同调优方法,其特征在于,所述步骤S1包括:

S11:使用Lasso算法对最重要的20维参数进行选取;其最小化的目标函数为:

FLasso=||y-Xw||22+α||w||1

通过对最小二乘法加上一个惩罚项来对重要特征参数进行提取;其中w为各特征参数的系数,w越大表明该参数越重要,当某特征参数的系数w取值为0时则剔除该项参数,通过此种方法提取出20维对模型输出影响最大的系数;

S12:对于这20维参数,随机生成200套配置参数;若为数值型参数则在以下公式确定的范围内进行随机取值:

range=[dp/x,dpx]

其中dp为参数p的默认值,x为固定的比例系数,在本发明取x=10;

若配置参数的取值为布尔型或者枚举类型的值则使用One-Hot编码方式对参数值进行编码,然后在取值范围内随机选取参数值。

3.根据权利要求2所述的面向动态负载场景的大数据系统跨层配置参数协同调优方法,其特征在于,所述步骤S2包括:

S21:依据S1生成的200套配置参数,通过自动化部署代码将相应的参数取值更新至数据存储层、资源调度层、数据处理层中对应的软件中;

S22:将工作负载加入大数据处理流程中,获取配置对应在该工作负载下的性能标签;

S23:根据上一步得到的配置及其对应的性能标签生成配置性能矩阵。

4.根据权利要求1所述的面向动态负载场景的大数据系统跨层配置参数协同调优方法,其特征在于,所述步骤S3包括:

S31:处理配置性能矩阵,按照60%∶20%∶20%的比例将配置性能矩阵拆分为三个部分,分别作为供随机森林进行性能模型建模使用的训练数据集、验证数据集以及测试数据集;

S32:对于训练集中的数据采用Bootstrap策略抽取n组相同维度样本集,这n组样本集具有相同的样本个数,但样本不一定相同,同时每个样本具有相同维数的配置参数特征,但配置参数特征不一定相同;

S33:每一个样本集建立一个回归树模型,共计n个回归树;

S34:n个回归树的输出为{pt1,pt2…ptn},取其平均值作为模型的最终输出

并将该工作负载的特征及其对应的性能模型存储在系统中,用以将来新工作负载的比较与迁移。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽大学,未经安徽大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110313931.7/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top