[发明专利]一种大数据处理平台配置的自动优化方法在审
申请号: | 201911234883.1 | 申请日: | 2019-12-05 |
公开(公告)号: | CN113032033A | 公开(公告)日: | 2021-06-25 |
发明(设计)人: | 陈超;喻之斌 | 申请(专利权)人: | 中国科学院深圳先进技术研究院 |
主分类号: | G06F9/445 | 分类号: | G06F9/445 |
代理公司: | 北京市诚辉律师事务所 11430 | 代理人: | 耿慧敏 |
地址: | 518055 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据处理 平台 配置 自动 优化 方法 | ||
1.一种大数据处理平台配置的自动优化方法,其特征在于,根据以下步骤收集配置参数训练集:
随机生成大数据处理平台的一组配置参数,运行该组配置参数,并对执行时间t进行监测,当执行时间t超过动态设置的最大准许时间Tmax时,终止运行;
在配置参数运行过程中,根据执行时间t的波动情况确定是否退出收集配置参数训练集的过程;
决定退出收集配置参数训练集的过程后,在所有运行成功的配置参数中选择执行时间最短的一组配置参数作为最优配置参数。
2.根据权利要求1所述的大数据处理平台配置的自动优化方法,其特征在于,根据以下步骤确定是否退出收集配置参数训练集的过程:
设定时间改进值为其中tc为本次成功运行的时间,tp为对比时间;
设置时间阈值为Tthres,当运行成功且δ>Tthres时,tp更新为当前时间;
n的初始值为n=0,当每次运行成功且δ≤Tthres时,n=n+1,当运行成功且δ>Tthres时,n=0;
当n大于设定的次数阈值时,则决定退出收集配置参数训练集的过程。
3.根据权利要求2所述的大数据处理平台配置的自动优化方法,其特征在于,根据以下步骤确定是否退出收集配置参数训练集的过程:
设置程序终止的次数ns的初始值为ns=0,当出现程序终止的情况时,ns=ns+1,当运行成功且δ>Tthres时,ns=0,如果程序终止时ns大于设定的终止次数阈值,则决定退出收集配置参数训练集的过程。
4.根据权利要求2所述的大数据处理平台配置的自动优化方法,其特征在于,根据以下步骤确定最大准许运行时间Tmax:
将最大准许时间Tmax初始值设置为无穷大,当运行成功且δ>Tthres时,Tmax=t+Δt,其中t为该次运行成功的时间,Δt用来表示由于机器性能波动所造成的时间损失。
5.根据权利要求4所述的大数据处理平台配置的自动优化方法,其特征在于,Δt设置为固定值5秒。
6.根据权利要求2所述的大数据处理平台配置的自动优化方法,其特征在于,每次运行时,将运行时间和运行状态表示为s={P,F,T,N},其中状态P表示成功运行,状态F表示由于配置参数的原因运行失败,状态T表示由于超过最大准许时间Tmax被终止运行,状态N表示运行成功,但是运运行时间改进值δ<0。
7.一种计算机可读存储介质,其上存储有计算机程序,其中,该程序被处理器执行时实现根据权利要求1至6中任一项所述方法的步骤。
8.一种计算机设备,包括存储器和处理器,在所述存储器上存储有能够在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现权利要求1至6中任一项所述的方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院深圳先进技术研究院,未经中国科学院深圳先进技术研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911234883.1/1.html,转载请声明来源钻瓜专利网。