[发明专利]一种基于深度强化学习的建筑能耗预测方法及系统有效
申请号: | 201810796307.5 | 申请日: | 2018-07-19 |
公开(公告)号: | CN109063903B | 公开(公告)日: | 2021-04-09 |
发明(设计)人: | 汪明;张仁昊;张燕鲁;董慧芳;王雁 | 申请(专利权)人: | 山东建筑大学 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q50/08;G06N3/04 |
代理公司: | 济南圣达知识产权代理有限公司 37221 | 代理人: | 董雪 |
地址: | 250101 山东省济*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 强化 学习 建筑 能耗 预测 方法 系统 | ||
本发明公开了一种基于深度强化学习的建筑能耗预测方法及系统,包括:采集建筑能耗历史数据,同时采集建筑面积、建筑常住人口数量、建筑常住人口消费水平、建筑所在地天气状况数据。将采集到的数据样本分组,根据所得到的训练样本输入到深度强化学习网络模型中进行训练并保存使状态动作值函数最优的网络模型。最后将预测样本输入到深度强化学习网络模型,进行建筑能耗预测。本发明采用深度学习中的卷积神经网络与强化学习中的Q学习相结合的方法实现了建筑的能耗预测,相对于传统的预测方法,用卷积神经网络结合Q学习算法的深度强化学习网络可以减少数据量,降低数据的存储要求,提高数据的使用效率,加快数据处理的效率。
技术领域
本发明涉及建筑能耗预测技术领域,尤其涉及一种基于深度强化学习的建筑能耗预测方法及系统。
背景技术
随着人类对能源需求的不断增长,能源问题日益突出。在建筑这一行业,减少建筑的综合耗能,提高建筑能源的使用效率已经成为了当今社会发展的研究热点。对建筑系统能耗进行宏观的评估与分析,进而建立可预测建筑能耗的模型被视为实现建筑节能的重要手段。
强化学习是一种从环境映射到动作的学习,目的是使agent在与环境的交互过程中获得最大的累计奖赏,但是在大状态空间下用迭代贝尔曼方程求解状态动作值函数是不可取的。在强化学习算法中可以用深度学习神经网络去近似表示值函数或策略。
深度学习神经网络具有高效率性,用训练好的深度学习神经网络去预测数据具有很高的准确度与速度;深度学习具有可塑性,深度学习模型可以根据具体情况持续改进,这使得它具有很强的灵活性和成长性;深度学习具有普适性,它可以根据问题调整参数修改模型,理论上能够适用于不同种类的问题。特别是深度学习中的卷积神经网络(CNN)有着很优秀的处理大量数据的能力,它具有很强的容错能力与并行处理数据的能力。卷积神经网络(CNN)可以提取出大量数据样本的本质特征,而且它可以利用卷积层与池化层减少数据量,降低数据的存储要求。
目前未见将深度学习神经网络应用于建筑能耗预测方面的相关文献。
综上所述,本发明利用强化学习中的Q学习算法与深度学习中的卷积神经网络相结合的方式提出了一种基于深度强化学习的建筑能耗预测方法。
发明内容
为解决现有技术存在的不足,本发明提供一种基于深度强化学习的建筑能耗预测方法及系统,将强化学习中的Q学习算法与深度学习中的卷积神经网络相结合,通过分析建筑能耗的影响因素,将建筑能耗的影响因素与建筑能耗历史数据同时作为输入数据,提高了建筑能耗预测的准确度。利用卷积神经网络结合Q学习算法实现的深度强化学习减少了数据量,降低了数据的存储要求,提高了数据的使用效率,加快了数据处理的效率。
为了实现上述目的,本发明采用如下技术方案:
在一个或者多个实施例公开的一种基于深度强化学习的建筑能耗预测方法,包括:
采集建筑能耗历史数据,同时采集建筑面积、建筑常住人口数量、建筑常住人口消费水平、建筑所在地天气状况数据;
采集得到的数据划分为训练样本集和预测样本集,对样本集数据进行预处理;
将训练样本集数据输入到深度强化学习模型中进行训练,直到得到最优的状态动作值函数后停止,并保存训练后的深度强化学习模型;
深度强化学习模型采用训练样本的输入向量为xi,每一个输入向量中包含n个元素,输入向量经过卷积神经网络与全连接神经网络运算后,输出状态动作值,通过状态动作值获取迭代后的损失函数,进而获得权值更新的梯度,使用梯度下降法更新权值;
将预测样本输入到训练后的深度强化学习网络模型,进行建筑能耗预测。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东建筑大学,未经山东建筑大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810796307.5/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理