[发明专利]控制方法和计算机可读存储介质有效
申请号: | 201910677520.9 | 申请日: | 2019-07-25 |
公开(公告)号: | CN110398029B | 公开(公告)日: | 2021-07-09 |
发明(设计)人: | 孙一凫;陈毅兴;吴若飒;沈启;孟芦;陈海阳 | 申请(专利权)人: | 北京上格云技术有限公司 |
主分类号: | F24F11/62 | 分类号: | F24F11/62 |
代理公司: | 北京睿派知识产权代理事务所(普通合伙) 11597 | 代理人: | 刘锋 |
地址: | 102101 北京市延庆区中*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 控制 方法 计算机 可读 存储 介质 | ||
1.一种暖通空调系统的控制方法,所述暖通空调系统包括冷热源系统和末端风盘系统,其特征在于,所述方法包括:
获取初始系统控制模型,所述初始系统控制模型包括第一初始系统控制模型和第二初始系统控制模型,所述第一初始系统控制模型用于控制所述末端风盘系统,所述第二初始系统控制模型用于控制所述冷热源系统;
在第一周期组的第一个周期内,根据所述初始系统控制模型控制所述暖通空调系统;以及
根据控制所述暖通空调系统的历史记录确定每个周期组的系统控制模型,所述历史记录包括控制数据和控制指标,所述控制指标用于表征控制效果;
其中,每个周期组包括两个周期,周期组内的第一个周期的系统控制模型根据上一个周期组的历史记录确定,周期组内的第二个周期的系统控制模型根据第一个周期的系统控制模型更新获得。
2.根据权利要求1所述的方法,其特征在于,获取初始系统控制模型包括:
确定目标建筑的仿真模型,所述仿真模型包括目标建筑的物理组成以及目标建筑中的暖通空调系统;以及
根据所述仿真模型基于输入状态和动作获取所述初始系统控制模型。
3.根据权利要求2所述的方法,其特征在于,根据所述仿真模型基于输入状态和动作获取所述初始系统控制模型包括:
根据所述仿真模型基于第一输入状态和第一动作获取第一初始系统控制模型,所述第一输入状态包括室内温度与目标温度的差值、室外温度与目标温度的差值、冷站供水温度、风盘档位、时间点和日期类型,所述第一动作为选择风盘档位;以及
根据所述仿真模型基于第二输入状态和第二动作获取第二初始系统控制模型,所述第二输入状态包括室外温度、瞬时冷流量、供水温度、时间点和日期类型,所述第二动作为选择供水温度和供回水温差。
4.根据权利要求3所述的方法,其特征在于,根据所述仿真模型基于第一输入状态和第一动作获取第一初始系统控制模型包括:
确定初始深度强化网络模型;
基于深度强化学习算法更新所述初始深度强化网络模型的权重值;以及
将控制所述仿真模型中的末端风盘系统的控制指标优于预定阈值时的深度强化网络模型作为第一初始系统控制模型。
5.根据权利要求4所述的方法,其特征在于,基于深度强化学习算法更新所述初始深度强化网络模型的权重值包括:
获取第一动作、第一奖励函数和当前时刻第一输入状态;
根据所述第一动作和第一奖励函数获取第一奖励值和下一时刻第一输入状态;以及
根据当前时刻第一输入状态、第一动作、第一奖励值和下一时刻的输入状态更新所述初始深度强化网络模型的权重值。
6.根据权利要求5所述的方法,其特征在于,所述第一奖励函数为:
其中,r1为第一奖励值,d实际温度与目标温度的差值。
7.根据权利要求3所述的方法,其特征在于,根据所述仿真模型基于第二输入状态和第二动作获取第二初始系统控制模型包括:
确定初始深度确定性策略梯度网络模型;
基于深度确定性策略梯度算法更新所述初始深度确定性策略梯度网络模型的权重值;以及
将控制所述仿真模型中的冷热源系统的控制指标优于预定阈值时的深度确定性策略梯度网络模型作为第二初始系统控制模型;
其中,所述控制指标用于表征控制效果。
8.根据权利要求7所述的方法,其特征在于,基于深度确定性策略梯度算法更新所述初始深度确定性策略梯度网络模型的权重值包括:
获取第二动作、第二奖励函数和当前时刻第二输入状态;
根据所述第二动作和第二奖励函数获取第二奖励值和下一时刻第二输入状态;以及
根据所述当前时刻第二输入状态、第二动作、第二奖励值和下一时刻第二输入状态更新所述初始深度确定性策略梯度网络模型的权重值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京上格云技术有限公司,未经北京上格云技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910677520.9/1.html,转载请声明来源钻瓜专利网。