[发明专利]一种基于强化学习的暖通空调个性化调控方法在审
申请号: | 202310279099.2 | 申请日: | 2023-03-21 |
公开(公告)号: | CN116182343A | 公开(公告)日: | 2023-05-30 |
发明(设计)人: | 苏永新 | 申请(专利权)人: | 湘潭大学 |
主分类号: | F24F11/61 | 分类号: | F24F11/61;F24F11/64;F24F11/63;F24F11/88;F24F110/10 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 41110*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 强化 学习 暖通 空调 个性化 调控 方法 | ||
1.一种基于强化学习的暖通空调个性化调控方法,其特征在于,包含以下步骤:
步骤S1:基于逻辑回归,构建大众数据集和个人数据集相结合的个性化热舒适模型,预测用户的个性化热舒适水平,然后根据PMV模型逆推得到用户的个性化热舒适温度区间,建立暖通空调的室温舒适性约束;其中,PMV指的是predicted mean vote,即预测平均投票;
步骤S2:获取电网未来24小时的分时电价数据,并生成电价趋势信号;
步骤S3:以满足用户个性化热舒适性要求且暖通空调未来24小时电费最低为目标,建立基于DQN的暖通空调个性化调控的强化学习模型,DQN网络以n时段的暖通空调开关状态、外墙、室内、阁楼及内部组件的气温、电价趋势数据、室外气温、通过外墙、屋顶及窗户的太阳辐射、对流换热系数和室内热源显热增益组成的状态量为输入,以控制动作对应的Q值为输出,以此选择Q值最大的控制动作支配暖通空调工作;其中,DQN指的是deep Q network,即深度Q网络;
步骤S4:暖通空调个性化调控的强化学习模型训练至收敛后,由该强化学习模型输出控制动作给实际暖通空调,支配实际暖通空调运行。
2.根据权利要求1所述的一种基于强化学习的暖通空调个性化调控方法,其特征在于,步骤S1所述的“基于逻辑回归,构建大众数据集和个人数据集相结合的个性化热舒适模型,预测用户的个性化热舒适水平,然后根据PMV模型逆推得到用户的个性化热舒适温度区间,建立暖通空调的室温舒适性约束”,包含以下步骤:
步骤S101:确定个性化热舒适模型的输入特征,输入特征来自PMV模型的6个影响因素,即空气温度Tin、相对湿度风速va、平均辐射温度Tr、人体代谢率M和服装热阻Rcl,将它们按上述顺序展开成一维序列进行输入,即确定个性化热舒适模型的输出标签,输出标签为用户的热舒适水平值L,共分为7类,分别代表用户对当前室内气温的7种不同热感觉;
步骤S102:以平均热舒适水平和个人热舒适水平Lp的线性组合值作为训练集的标签,即其中ξ为常数;
步骤S103:基于逻辑回归的个性化热舒适模型训练至最优后,可用于个性化预测,即输出目标用户的个性化热舒适水平值;
步骤S104:判断预测的个性化热舒适水平值L是否为“0”,若为“0”,则表示用户对当前环境感到舒适,从而得到用户感到舒适时的pmv值范围,再根据PMV模型逆推得到此时的所有空气温度值,取其最大值、最小值作为室内气温的上限Th和下限Tl,即用户的个性化热舒适温度区间为[Tl,Th];建立暖通空调的室温舒适性约束为:暖通空调运行过程中,室内温度处于[Tl,Th]区间内。
3.根据权利要求1所述的一种基于强化学习的暖通空调个性化调控方法,其特征在于,步骤S2所述的“获取电网未来24小时的分时电价数据,并生成电价趋势信号”,包括:
将当前时段的电价和与它相邻的未来一段时间内的平均电价进行比较,生成电价趋势信号,具体规则是:若未来一段时间内的平均电价高于当前时段的电价,则电价趋势信号上升;若未来一段时间内的平均电价低于当前时段的电价,则电价趋势信号下降;否则,电价趋势信号维持不变。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湘潭大学,未经湘潭大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310279099.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种具有促渗透功效的组合物及其应用
- 下一篇:一种金属加工生产探伤检测设备