[发明专利]一体化数据中心柜末端空调系统节能优化方法及装置有效
申请号: | 202111573336.3 | 申请日: | 2021-12-21 |
公开(公告)号: | CN114330852B | 公开(公告)日: | 2022-09-23 |
发明(设计)人: | 贾庆山;胡潇;唐静娴 | 申请(专利权)人: | 清华大学 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q50/06;G06N7/00;G06N3/04;G06N3/08;F24F11/88 |
代理公司: | 北京三友知识产权代理有限公司 11127 | 代理人: | 郝博;沈珍珠 |
地址: | 10008*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一体化 数据中心 末端 空调 系统 节能 优化 方法 装置 | ||
1.一种一体化数据中心柜末端空调系统节能优化方法,其特征在于,包括:
确定一体化数据中心柜末端空调系统的马尔可夫决策过程模型;
构建一体化数据中心柜仿真环境;
在所述仿真环境中,基于马尔可夫决策过程模型,对基于价值的函数逼近型差分强化学习算法进行训练,输出训练好的动作价值函数,在训练过程中通过不断更新时序差分误差、平均收益估计值,实现对动作价值函数的参数的更新;
基于训练好的动作价值函数,实时获取当前时刻最大动作价值函数值对应的动作;
获得当前时刻最大动作价值函数值对应的动作对应的空调压缩机的开关状态;
所述马尔可夫决策过程模型包括末端空调系统的状态、动作和奖励函数,其中,
末端空调系统的状态表示为:
其中,St为t时刻末端空调系统的状态;Ttin、Ttout、Ttret、分别为t时刻服务器进风口温度、t时刻服务器出风口温度、t时刻空调回风温度、t时刻服务器的负载率;
末端空调系统的动作表示为:
At=θt
其中,At为t时刻的动作;θt为t时刻空调压缩机的开关状态;
奖励函数表示为:
其中,为t时刻采取了动作At后末端空调系统运行功耗对应的收益;为t时刻采取了动作At后服务器出风口温度对应的收益;λ为参数。
2.如权利要求1所述的方法,其特征在于,末端空调系统运行功耗对应的收益表示为:
其中,Pt为t时刻末端空调系统制冷功率;
服务器出风口温度对应的收益表示为:
或
其中,为t+1时刻服务器出风口温度,为服务器出风口允许温度上限,为服务器出风口允许温度下限。
3.如权利要求1所述的方法,其特征在于,确定一体化数据中心柜末端空调系统的马尔可夫决策过程模型,包括:
根据末端空调系统运行原理和末端空调系统运行功率确定一体化数据中心柜末端空调系统节能问题的优化目标、约束条件;
分析所述优化目标和约束条件,确定一体化数据中心柜末端空调系统节能问题的决策变量为空调压缩机的开关状态;
基于所述优化目标和约束条件,确定所述马尔可夫决策过程模型的状态和奖励函数;
基于所述决策变量,确定所述马尔可夫决策过程模型的动作。
4.如权利要求3所述的方法,其特征在于,在所述仿真环境中,基于马尔可夫决策过程模型,对基于价值的函数逼近型差分强化学习算法进行训练,输出训练好的动作价值函数,包括:
确定训练时间步数、学习率、平均收益因子和动作价值函数,所述动作价值函数包含末端空调系统的状态、动作和参数;
任意初始化动作价值函数的参数,任意初始化平均收益估计值,初始化末端空调系统的状态;
循环执行以下步骤,直至达到训练时间步数,输出训练好的动作价值函数:
使用从动作价值函数中得到的策略,选择当前时刻的动作;
采取当前时刻的动作,通过仿真环境获得下一时刻末端空调系统的状态的观测值,计算下一时刻的奖励函数值,并将当前时刻末端空调系统的状态的观测值和动作、下一时刻末端空调系统的状态的观测值和奖励函数值放入经验池中;
在经验池中采样一个任意时刻的四元组,所述任意时刻的四元组包括任意时刻末端空调系统的状态的观测值和动作、所述任意时刻的下一时刻的末端空调系统的状态的观测值和奖励函数值;
根据所述任意时刻的四元组,更新时序差分误差;
根据更新的时序差分误差和平均收益因子,更新平均收益估计值,所述平均收益估计值为当前时刻对平均收益的估计;
根据所述任意时刻的动作价值函数值、学习率、更新的时序差分误差,更新动作价值函数的参数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111573336.3/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理