[发明专利]基于多步预测深度强化学习算法的HVAC控制系统有效

申请号：	202110403130.X	申请日：	2021-04-14
公开（公告）号：	CN113112077B	公开（公告）日：	2022-06-10
发明（设计）人：	任密蜂;刘祥飞;杨之乐;张建华	申请（专利权）人：	太原理工大学
主分类号：	G06Q10/04	分类号：	G06Q10/04;G06Q50/06;H02J3/00;G06N3/04;G06N3/08
代理公司：	太原市科瑞达专利代理有限公司 14101	代理人：	江淑兰
地址：	030024 山西***	国省代码：	山西;14
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	基于预测深度强化学习算法 hvac 控制系统
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明涉及温度、湿度、空气清净度以及空气循环(Heating,Ventilation,Air‑conditioningand Cooling,HVAC)的控制系统的智能控制方法，具体是一种基于广义互熵(generalizedcorrentropy,GC)损失函数的长短期记忆神经网络(Long Short‑term Memory,LSTM)和深度强化学习(Deep Reinforcement Learning,DRL)算法的HVAC控制系统。该方法包括的步骤如下：采集室外环境温度、室内环境温度和电网的电价信息，对采集到的数据进行预处理，使用室外环境温度历史数据预测未来多步的室外环境温度，基于未来室外温度值、室内环境温度和电网电价信息利用DRL的深度确定性策略(Deep Deterministic Policy Gradient,DDPG)算法控制HVAC系统的功率输出。本发明能实时智能控制HVAC系统以减少用户成本并且保证用户的满意度，具有较高的实际工程应用价值。

技术领域

本发明涉及一种智能优化控制HVAC系统的方法，具体是一种基于GC-LSTM神经网络和DRL算法对HVAC系统进行智能控制的研究方法。

背景技术

家庭用户作为电网的终端用户，用户的用电习惯和分布式可再生能源的加入将直接导致电网波峰和波谷的出现；给电网带来了严重的冲击并造成严重性威胁。随着近几年智能电网的发展与“需求响应”策略的实施，使居民用户由被动变为积极主动的加入电网；在智能电网环境下，电网的电价信息和发电量信息将和用户的需求信息进行双向交流。在家庭用户中，空调系统的耗电量约占整个用户用电量的35％，因此在满足用户一定舒适度的前提下，根据电网电价和环境的温度信息智能控制HVAC系统的输出功率，对于减少电量的使用、减少用户成本和降低温室效应具有重要意义。

目前，HVAC系统主要采用传统的控制方式闭环控制和模型预测控制算法，闭环控制系统内部有一个温度传感器，当检测到室内温度达到设定值时，就会使HVAC系统停止工作，基于闭环控制方式的HVAC系统操作简单，易于实现，但是在智能电网和需求相应策略的环境下，难易根据动态电价去进行功率变换，以达到节能减排的标准；模型预测控制算法是通过建立室内温度变化的准确模型进而对HVAC系统进行控制，然而，室内环境温度变化的复杂性将影响到建模的准确性。随着智能算法的发展，研究者也提出使用粒子群优化算法和遗传算法优化对HVAC系统进行优化控制，该类算法在实时电价的机制下优化控制HVAC系统的功率输出，以减小用户的成本，该算法具有调参难的特点，并且没有考虑HVAC系统的功率输出对室内温度改变具有延时性问题，没有真正的保证用户的舒适度。因此首先需要对未来室外环境温度值进行预测。

发明内容

本发明针对室外环境温度和智能电网电价的非线性、随机性和HVAC系统输出的功率对室内环境温度变化的延时性，提出一种基于多步预测深度强化学习算法的HVAC控制系统进行控制的方法。

本发明采用如下技术方案实现，基于多步预测深度强化学习算法的HVAC控制系统，其模型结构如图1所示，包括室外环境温度的多步预测和室内温度的实时控制两个阶段，其中室外环境温度的预测阶段包括以下步骤：

步骤一：根据室外环境的实际数据点，选取连续的i个时刻的室外环境温度X＝[T₁,…,T_i]作为多步温度预测模型的输入，以h＝[h_i+1,…,h_i+n]作为模型的真实输出，n为多步预测的步数；

步骤二：对采集到的数据进行预处理，对异常的数据进行修正，并将时间序列的数据转换为监督序列的数据；

步骤三：将输入量输入到基于广义互熵损失函数的长短期记忆神经网络中，利用长短期记忆神经网络的遗忘门、输入门和输出门对输入量进行遗忘、记忆和学习；基于广义互熵损失函数的长短期记忆神经网络的非线性回归模型描述如下：

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于太原理工大学，未经太原理工大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202110403130.X/2.html，转载请声明来源钻瓜专利网。

上一篇：一种建筑垃圾制备再生建筑材料的设备及生产方法
下一篇：海洋生物体中主要重金属元素的测定方法

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法；其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政；管理
G06Q10-02 .预定，例如用于门票、服务或事件的
G06Q10-04 .预测或优化，例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理，例如组织、规划、调度或分配时间、人员或机器资源；企业规划；组织模型
G06Q10-08 .物流，例如仓储、装货、配送或运输；存货或库存管理，例如订货、采购或平衡订单
G06Q10-10 .办公自动化，例如电子邮件或群件的计算机辅助管理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]基于多步预测深度强化学习算法的HVAC控制系统有效

专利文献下载