[发明专利]一种在智能电厂中基于联邦学习提升火灾检测效果的方法在审
申请号: | 202011244597.6 | 申请日: | 2020-11-09 |
公开(公告)号: | CN112598150A | 公开(公告)日: | 2021-04-02 |
发明(设计)人: | 杨端;许晓伟;韩志英;孙曼;雷施雨;张翰轩 | 申请(专利权)人: | 西安君能清洁能源有限公司 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q50/06;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 西安通大专利代理有限责任公司 61200 | 代理人: | 高博 |
地址: | 710000 陕西省西安市高新区唐*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 智能 电厂 基于 联邦 学习 提升 火灾 检测 效果 方法 | ||
1.一种在智能电厂中基于联邦学习提升火灾检测效果的方法,其特征在于,包括以下步骤:
步骤1,在给定资源预算的时变通信环境中得到局部更新和全局参数聚合,建立聚合频率问题模型,对其进行简化;
步骤2,通过使用深度强化学习来解决本地频率更新的问题,DT通过与环境交互学习模型;将优化后的问题制定为MDP模型,其中包括系统状态S(t),动作空间A(t),策略P,奖励函数R和下一状态S(t+1);
步骤3,基于DQN的聚合频率优化算法解决MDP问题;
步骤4,基于DQN的异步联邦学习,通过聚类对具有不同计算能力的节点进行分类,并为每个聚类配置相应的管理者,使每个聚类能够以不同的本地聚合频率自主训练;对于集群,通过基于DQN的自适应聚合频率校准算法获得聚合频率。
2.根据权利要求1所述的一种在智能电厂中基于联邦学习提升火灾检测效果的方法,其特征在于,步骤1具体包括:
聚合频率问题P1表述为:
其中wk表示第k个全局聚合之后的全局参数,F(wk)是第k次全局聚合后的损失值,{a0,a1,...,ak}是一组本地更新频率的策略,ai指示第i次全局更新所需的本地更新数量;条件(1a)表示现有资源的既定预算,β表示整个学习过程中资源消耗率的上限;通过信任聚合来校准由于DT在节点计算能力中的映射偏差而导致的计算能耗Ecmp的偏差;
经过k轮全局聚合,简化P1和长期资源预算约束,训练的损失值写为:
其中最优训练结果就是:
基于Lyapunov优化,将长期资源预算划分为每个时隙的可用资源预算,通过建立动态资源短缺队列,实现了P1的简化;资源短缺队列的长度被定义为所使用的资源和可用资源之间的差异;资源总量的限制是Rm,第k次聚合中可用的资源是βRm/k;资源短缺队列的表示如下:
Q(i+1)=max{Q(i)+(aiEcmp+Ecom)-βRm/k,0} (4)
其中,(aiEcmp+Ecom)-βRm/k是第k个聚合中资源的偏差;从而,原始问题P1转化为以下问题P2:
其中v和Q(i)是与性能提升难度和资源消耗队列有关的权重参数,v随着训练回合的增加而增加。
3.根据权利要求2所述的一种在智能电厂中基于联邦学习提升火灾检测效果的方法,其特征在于,公式(1)和条件(1a)中,损失值F(wk)和计算能耗Ecmp分别包含训练状态和计算能力f(i),由DT对其进行估计,确保能够掌握整个联邦学习的关键状态。
4.根据权利要求1所述的一种在智能电厂中基于联邦学习提升火灾检测效果的方法,其特征在于,步骤2具体包括:
系统状态:系统状态描述每个节点的特征和训练状态,包括所有节点的当前训练状态资源短缺队列Q(i)的当前状态和每个节点τ(t)的神经网络隐藏层输出的verage值,即,
动作空间:该动作集定义为向量表示需要离散化的本地更新的数量;由于决策基于特定时间t,用ai代替
奖励函数:目标是确定本地更新和全局参数聚合之间的最佳权衡,以最小化损失函数,奖励函数与总体损失函数的下降程度和资源短缺队列的状态有关;其评估函数:
R=[vF(wi-1)-F(wi)]-Q(i)(aiEcmp+Ecom) (7)
下一状态:当前状态S(t)由DT实时映射提供,下一个状态S(t+1)是DT对DQN模型在现实运行后状态的预测,表示为S(t+1)=S(t)+P(S(t))。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安君能清洁能源有限公司,未经西安君能清洁能源有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011244597.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种电线电缆抗热性能检测装置
- 下一篇:一种多功能工具桌
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理