[发明专利]一种基于深度强化学习的压缩机故障诊断方法有效
申请号: | 202110280530.6 | 申请日: | 2021-03-16 |
公开(公告)号: | CN113095367B | 公开(公告)日: | 2023-04-18 |
发明(设计)人: | 陈焕新;韩林志;钟寒露;吴俊峰;李正飞;申利梅 | 申请(专利权)人: | 华中科技大学 |
主分类号: | G06F18/214 | 分类号: | G06F18/214;G06F16/2458 |
代理公司: | 华中科技大学专利中心 42201 | 代理人: | 夏倩;李智 |
地址: | 430074 湖北*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 强化 学习 压缩机 故障诊断 方法 | ||
1.一种基于深度强化学习的压缩机故障诊断方法,其特征在于,包括:
采集压缩机的实时运行数据,输入至已训练好的特征提取模型,以提取所述实时运行数据的特征;所述特征提取模型用于以无监督的方式提取输入数据的特征,所述特征用于表征在对应的运行数据下,所述压缩机处于各故障类型的概率;运行数据包括:压缩机吸气温度、压缩机吸气压力、压缩机排气温度、压缩机排气压力、压缩机电流和压缩机频率;
将所述实时运行数据的特征输入至已训练好的故障诊断模型,以由所述故障诊断模型输出所述压缩机所处的故障类型;所述故障诊断模型为深度强化学习模型,用于以输入的特征为状态,预测在该状态下能够得到最大奖励值时所采取的动作,并获得与该动作相对应的故障类型作为所述压缩机的故障诊断结果;在给定状态下,所述深度强化学习模型的一个动作用于预测所述压缩机在所述给定状态处于某一种故障状态;
所述特征提取模型为自编码器模型中的编码器,其训练方法包括:
建立自编码器模型,其中的编码器用于提取输入数据的特征,解码器用于根据编码器提取的特征重构数据;
获取所述压缩机在不同故障状态下的历史运行数据,并输入所建立的自编码器模型以对所述自编码器模型进行训练,在训练过程中,不断调整所述自编码器模型的参数以使重构误差最小;
在所述自编码器训练结束后,将其中的编码器作为所述特征提取模块。
2.如权利要求1所述的基于深度强化学习的压缩机故障诊断方法,其特征在于,所述故障诊断模型的训练方法包括如下步骤:
(S1)建立深度强化学习模型,并初始化Q表,并利用所述特征提取模块提取所述历史运行数据的特征作为训练数据集;
所述Q表的行与状态对应,所述Q表的列与动作对应,每个单元格的值是给定状态和动作下奖励总和期望的最大值;
(S2)采用ε-greedy策略在当前状态st选择一个动作at,以由环境反馈在状态st下选择动作at的奖励,根据奖励计算得分,并进入下一个状态st+1;
动作at对应的故障诊断结果正确时,奖励为正值,动作at对应的故障诊断结果错误时,奖励为负值;得分与所有奖励的累加值正相关;
(S3)按照更新所述Q表;
(S4)按时序依次将所述训练数据集中的特征作为当前状态,并执行步骤(S2)~(S3),直至达到最大的迭代次数,以完成一个轮次的迭代训练,输出相应的得分并转入步骤(S5);
(S5)重复执行步骤(S4),以进行多个轮次的迭代训练,直至获得最高得分;
其中,Qnew(st,at)和Q(st,at)分别表示更新前、后所述Q表中状态st和动作at对应的单元格的值,Rt+1表示在状态st采取动作at的奖励,α表示学习率,a表示动作集合,γ表示折扣率,表示状态st+1下采取所有可能动作中的最大奖励。
3.如权利要求2所述的基于深度强化学习的压缩机故障诊断方法,其特征在于,得分计算规则为:动作at对应的故障诊断结果正确时,得分加x;动作at对应的故障诊断结果错误时,得分减x;
其中,x>0。
4.一种计算机可读存储介质,其特征在于,包括存储的计算机程序;所述计算机程序被处理器执行时,控制所述计算机可读存储介质所在设备执行权利要求1-3任一项所述的基于深度强化学习的压缩机故障诊断方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中科技大学,未经华中科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110280530.6/1.html,转载请声明来源钻瓜专利网。