[发明专利]一种基于深度强化学习的建筑能耗预测方法及系统有效
申请号: | 201810796307.5 | 申请日: | 2018-07-19 |
公开(公告)号: | CN109063903B | 公开(公告)日: | 2021-04-09 |
发明(设计)人: | 汪明;张仁昊;张燕鲁;董慧芳;王雁 | 申请(专利权)人: | 山东建筑大学 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q50/08;G06N3/04 |
代理公司: | 济南圣达知识产权代理有限公司 37221 | 代理人: | 董雪 |
地址: | 250101 山东省济*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 强化 学习 建筑 能耗 预测 方法 系统 | ||
1.一种基于深度强化学习的建筑能耗预测方法,其特征在于,包括:
采集建筑能耗历史数据,同时采集建筑面积、建筑常住人口数量、建筑常住人口消费水平、建筑所在地天气状况数据;
采集得到的数据划分为训练样本集和预测样本集,对训练样本集和预测样本集数据进行预处理;
将训练样本集数据输入到深度强化学习模型中进行训练,直到得到最优状态动作值函数后停止,并保存训练后的深度强化学习模型;其中,将训练样本集数据输入到深度强化学习模型中进行训练的过程具体为:
输入数据进入卷积计算层进行卷积计算;池化层采用Max pooling方法对输入数据进行压缩;输入数据经过卷积神经网络与全连接神经网络后输出状态动作值;利用输出的状态动作值计算输入数据的目标输出;利用当前输出的状态动作值与目标输出得到均方误差函数;用均方误差函数对权值求导,得到权值更新的梯度;用梯度下降法更新权值;
深度强化学习模型采用训练样本的输入向量为xi,每一个输入向量中包含n个元素,输入向量经过卷积神经网络与全连接神经网络运算后,输出状态动作值,通过状态动作值获取迭代后的损失函数;
将预测样本输入到训练后的深度强化学习模型,进行建筑能耗预测;
将进行过预处理的待预测日的前一天的建筑能耗数据、建筑面积、建筑常住人口数量、建筑常住人口消费水平、建筑所在地天气状况数据按类别分组作为输入向量xi,将进行过预处理的待预测日的建筑能耗数据添加数值标签后作为ai;利用最优状态动作值函数计算出输入向量xi的期望最大回报值,从而得到最优策略;
将强化学习中的Q学习算法与深度学习中的卷积神经网络相结合,分析建筑能耗的影响因素,将建筑能耗的影响因素与建筑能耗历史数据同时作为输入数据,提高建筑能耗预测的准确度,利用卷积神经网络结合Q学习算法实现的深度强化学习来减少数据量,降低数据的存储要求,提高数据的使用效率,加快数据处理的效率。
2.如权利要求1所述的一种基于深度强化学习的建筑能耗预测方法,其特征在于,所述最优状态动作值函数具体为:
Q*(xi,ai;|ωi)=maxπE[Ri|xi=x,ai=a,ωi=ω,π]
其中,Ri为输入向量xi的未来回报,I是输入样本总量,γ为折扣系数,用来权衡未来奖赏对累计奖赏的影响;π是输入向量xi与数值标签ai的映射函数;ωi为权值,x为输入样本;a为添加数值标签后的待预测日的建筑能耗数据;ω为权值;i'为Ri中的一个参数,代表Ri中的连加运算对i至I起作用,E为数学期望。
3.如权利要求1所述的一种基于深度强化学习的建筑能耗预测方法,其特征在于,利用输出的状态动作值计算输入数据的目标输出,具体为:
其中,xi为输入向量数据,Ri为输入向量数据xi的未来回报,γ为折扣系数,ω-随着网络训练的过程不断更新,E为数学期望;Qi'为输出的状态动作值;x为输入样本;a为添加数值标签后的待预测日的建筑能耗数据;xi'与ai'为区别于xi与ai的值。
4.如权利要求3所述的一种基于深度强化学习的建筑能耗预测方法,其特征在于,利用当前输出的状态动作值与目标输出得到均方误差函数,具体为:
其中,为数学期望。
5.如权利要求4所述的一种基于深度强化学习的建筑能耗预测方法,其特征在于,用均方误差函数对权值求导,得到权值更新的梯度,具体为:
其中,代表对ωi求导。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东建筑大学,未经山东建筑大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810796307.5/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理