[发明专利]一种数据中心能耗联合优化方法、系统、介质及设备有效
申请号: | 202110156330.X | 申请日: | 2021-02-04 |
公开(公告)号: | CN112966431B | 公开(公告)日: | 2023-04-28 |
发明(设计)人: | 苏远歧;秦露露;伍卫国 | 申请(专利权)人: | 西安交通大学 |
主分类号: | G06F30/27 | 分类号: | G06F30/27;G06F119/08 |
代理公司: | 西安通大专利代理有限责任公司 61200 | 代理人: | 高博 |
地址: | 710049 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据中心 能耗 联合 优化 方法 系统 介质 设备 | ||
1.一种数据中心能耗联合优化方法,其特征在于,包括以下步骤:
S1、构建数据中心多智能体环境;
S2、根据任务调度智能体scheduling_agent的状态空间、动作空间和奖励函数构建任务调度强化学习模型,具体为:
S201、建立scheduling_agent的状态空间,scheduling_agent的状态空间包括内部的资源状态和外部的环境状态,用二进制矩阵表示scheduling_agent的内部资源状态,包括机器资源的当前状态和队列中作业请求的资源配置情况,用s*t的二维矩阵表示某一类资源的状态,s表示资源最大容量,t表示最长执行时间,外部的环境状态包括服务器入口温度和服务器温度;
S202、建立scheduling_agent的动作空间,将动作action定义为i*q+j,表示将队列中的作业j分配给机器i,动作空间大小为m*q+1,m表示机器数,q表示等待任务队列的长度,动作空间包含一种无效操作,表示scheduling_agent在当前时间没有进行调度;
S203、根据二维矩阵的占用比例可以计算出各类资源的占用率,根据服务器的功耗模型Pmachine,结合温度限制条件设计scheduling_agent的奖励函数如下:
其中,第一部分为平均功率,目标是最小化,第二部分表示过热的惩罚函数,λ表示惩罚因子,当服务器功率超过温度阈值时会加大惩罚,从而反馈一个更小的奖励值;
S204、构建scheduling_agent的网络结构,scheduling_agent的控制网络包括两个网络:Actor网络和Critic网络,Actor网络包括动作估计网络和动作现实网络,两者具有相同的网络结构,动作现实网络每隔一段时间更新网络参数;Actor网络输入状态state为二维矩阵,输出为离散的动作action,网络结构包括两个二维卷积层和两个全连接层;
Critic网络具备双网络结构:状态估计网络和状态现实网络,Critic网络的输入是状态state和由Actor网络产生的动作action以及其他agent的信息,输出是动作对应的状态动作值函数,网络结构中第一层除卷积层外,再加一层全连接层用于输入动作action;
S3、根据温度调控智能体cooling_agent的状态空间、动作空间和奖励函数构建温度调控强化学习模型;
S4、基于步骤S2和步骤S3构建异构多智能体强化学习的联合控制模型,向联合控制模型中导入步骤S1构建的数据中心多智能体环境;
S5、使用步骤S4的联合控制模型,以数据中心整体能耗最小化为目标集中训练scheduling_agent与cooling_agent,实现整体能耗最小化。
2.根据权利要求1所述的方法,其特征在于,步骤S1中,数据中心多智能体环境具体为:
设定数据中心环境中存在精密空调、若干个服务器和若干个任务等待被执行,所有服务器属于同一个集群,每个服务器有若干种资源,还有一个固定长度的等待任务队列,每个任务在固定的时间段内请求固定数量的不同资源;在每个离散的时间步,传入的作业到达并进入等候队列,当队列已满时,后续作业的数量将保存在backlog中;集群的任务调度智能体scheduling_agent选择作业并分配给机器的分配,机器的温度随机器上任务的运行情况变化,精密空调中的温度调控智能体cooling_agent负责调整温度冷却发热的服务器。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安交通大学,未经西安交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110156330.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种氧传感器底座的焊接方法
- 下一篇:一种离心旋转式库壁清理装置及清理方法