[发明专利]一种面向混合部署数据中心场景的离线作业任务调度算法有效
申请号: | 202111089490.3 | 申请日: | 2021-09-16 |
公开(公告)号: | CN113821323B | 公开(公告)日: | 2023-09-19 |
发明(设计)人: | 李嘉伦;吴维刚 | 申请(专利权)人: | 中山大学 |
主分类号: | G06F9/48 | 分类号: | G06F9/48;G06N3/092 |
代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 刘俊 |
地址: | 510275 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 面向 混合 部署 数据中心 场景 离线 作业 任务 调度 算法 | ||
1.一种面向混合部署数据中心场景的离线作业任务调度算法,其特征在于,包括以下步骤:
S1:将数据中心中的每一条节点状态信息和离线作业信息都作为一个实体来处理,并构造一个实体集E;
S2:将实体集转化为数据中心节点状态和离线作业运行时行为特征表示;
S3:在深度强化学习DRL训练过程中将特征表示转化为关系归纳偏差;
将构建好的实体集E映射成三个矩阵Q、K、V,利用矩阵Q、K、V计算注意力输出值,用注意力输出值向量组去增强强化学习智能体决策能力;
利用矩阵Q、K、V计算注意力输出值采用如下方式:attention_output是最终计算得出的离线任务策略注意力权重,权重值是基于原始实体集E线性映射得出的三个矩阵Q、K、V得出来的,是用于归一化的缩放因子,归一化的目的是防止softmax()函数的输出分布过于陡峭,从而在深度学习训练中保持梯度值的稳定,dk是Q和K矩阵的列数,即向量的维度,softmax()函数会将输出的计算值归一化到(0,1)区间内,保证深度学习训练中梯度值的稳定性:
attention_output=Attention(Q,K,V)
步骤S3中,基于自注意力模块输出的注意力权重向量组,在奖励信号驱动的反馈机制下,DRL模型将捕获有益于促进正奖励的注意力权值,并在反馈奖励的驱动下逐步过滤掉致使调度结果变差的关系链接,通过迭代式的执行上述过程,得到所需的关系归纳偏差。
2.根据权利要求1所述的面向混合部署数据中心场景的离线作业任务调度算法,其特征在于,实体集中的每个实体将计算与所有其他实体的成对交互,每个与所有其他实体的成对交互的累积交互将分别为原始实体的行为特征表示。
3.根据权利要求1所述的面向混合部署数据中心场景的离线作业任务调度算法,其特征在于,步骤S3中,DRL模型的训练过程是:
1)、在数据中心运行中的每个时间点,收集数据中心的节点状态和等待队列中的离线作业信息;
2)、上述信息整合合并为一个实体集合E,用于接下来的使用;
3)、自注意力模块将会对E进行权重计算与编码输出权值向量组;
4)、DRL模型的策略基于自注意力模块的输出注意力权值向量组生成并优化,DRL模型会在奖励信号激励机制的引导下逐渐过滤无效的注意力权重并保留有效的注意力权重,从而逐步构建优质的DRL模型策略参数;
5)、基于不断更新的策略参数,根据当前的数据中心状态选取合适的调度动作并得到相应的奖励反馈信号,从而迭代式的优化DRL策略。
4.根据权利要求3所述的面向混合部署数据中心场景的离线作业任务调度算法,其特征在于,关系归纳偏差使得DRL模型捕获由当前运行的在线作业运行时行为与未知到达的离线作业任务聚合的不同的混合部署状态模式,而无需在DRL训练期间手动分析它们。
5.根据权利要求3所述的面向混合部署数据中心场景的离线作业任务调度算法,其特征在于,基于自注意力模块输出的注意力权重向量组代表注意力向量组捕获了数据中心节点状态和等待调度的离线作业任务之间的关系链接。
6.根据权利要求5所述的面向混合部署数据中心场景的离线作业任务调度算法,其特征在于,实体集中的每个实体将计算与所有其他实体的成对交互,该所有其他实体包括自身。
7.根据权利要求5所述的面向混合部署数据中心场景的离线作业任务调度算法,其特征在于,每个与所有其他实体的成对交互的累积交互将分别为原始实体的最终表示,该所有其他实体包括自身。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中山大学,未经中山大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111089490.3/1.html,转载请声明来源钻瓜专利网。