[发明专利]一种联邦学习与深度学习融合驱动的设备故障诊断方法在审
申请号: | 202011291656.5 | 申请日: | 2020-11-18 |
公开(公告)号: | CN112101489A | 公开(公告)日: | 2020-12-18 |
发明(设计)人: | 董志红;赵宜斌;王岩 | 申请(专利权)人: | 天津开发区精诺瀚海数据科技有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04 |
代理公司: | 天津企兴智财知识产权代理有限公司 12226 | 代理人: | 刘影 |
地址: | 300450 天津市滨海新区*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 联邦 学习 深度 融合 驱动 设备 故障诊断 方法 | ||
1.一种联邦学习与深度学习融合驱动的设备故障诊断方法,其特征在于,包括下述步骤:
S1. 在可信工厂侧产生的实时数据源上设置分布式训练子端LSTM故障诊断模型:根据业务问题设置数学模型,即包括输入层,一个隐含层和随机失活Dropout以及激活函数softmax输出层的LSTM神经网络,在模型训练完之后,部署于可信工厂侧的模型通过直接读入设备采集数据来进行故障分析;
S2.可信工厂采集数据特征提取:根据上一步中所述的分布式训练子端LSTM故障诊断模型对训练的要求,训练所用数据直接使用本地存储介质上的数据,通过读取载入来完成训练集加载,而数据集则根据故障特征提取可信工厂采集数据中的公共部分,取公共特征并在工厂域横向联合各数据集;
S3.本地模型训练:针对分布式训练子端LSTM故障诊断模型的训练,每个本地模型的训练按照传统单机LSTM神经网络设置相同的随机失活Dropout、学习率训练参数,以及设置样本批次batchsize、选择客户端选择百分比、迭代次数模型参数;
S4. 本地模型的中间参数上传:本地可信工厂侧的训练模型完成一次迭代之后,将中间训练参数上传给中心服务器,中心服务器在整个训练过程中充当训练协作者;
S5.参数融合与回传:充当训练协作者的中心服务器在汇总所有模型上传的模型参数之后,基于联邦学习定义的联邦分布式设备训练算法来计算更新梯度,并在计算完之后将更新矩阵分发回各个本地模型以完成自身的更新;
S6.完成全局共享模型训练:各个本地模型在达到训练协作者设置的迭代次数之后停止训练同时训练协作者确认联合损失函数收敛,停止参数上传,以及停止更新;在全局共享模型得到最优的参数之后,每次进行工厂设备故障诊断问题分析时,中心服务器上全局共享模型与可信工厂上分布式训练子端LSTM故障诊断模型具有相同的结构,因此读取输入样本后拟合数据特征;产生的结果将映射到对应的工厂设备故障类型上。
2.根据权利要求1所述的一种联邦学习与深度学习融合驱动的设备故障诊断方法,其特征在于:所述步骤S1中分布式训练子端LSTM故障诊断模型的流程包括以下步骤:
1-1)首先对设备的时序样本数据的故障数据样本进行处理,使用有异常并且已经确定故障类型的数据,另外再增加大量的正常样本;
1-2)重采样,使用K近邻方法对时序样本数据进行欠采样,选择到最远的3个故障样本平均欧式距离最小的那些正常样本,规避非平衡数据带来的数据不平衡的问题;
1-3)特征工程,使用经验模态分解EMD分解样本时序数据的原始振动信号,观察各阶段平稳固有模态分量本征模函数IMF特征,原始振动信号分解之后得到7个分量IMF1~IMF7和一个残差图,每一个IMF分量代表了原始振动信号中存在的一种本征模函数;
1-4)对时序数据的本征模函数IMF进行编号,得到模型输入数据X,根据编号确定模型的输出数据;
1-5)正规化数据,计算样本均值 和标准差,对数据X进行正规化,正规化后的数据为:
1-6)划分数据集,将数据随机排列,按相同比例划分输入数据 X和输出数据,得到训练数据集 和测试数据集 ;
1-7)训练模型,设置检查点,每一迭代次数Epoch保存一次模型参数,调整迭代次数Epoch和随机失活Dropout 参数,并观察训练损失trainloss和验证损失valloss。
3.根据权利要求1所述的一种联邦学习与深度学习融合驱动的设备故障诊断方法,其特征在于:所述步骤S5中,采用基于联邦学习定义的联邦分布式设备训练算法来计算更新梯度,步骤如下:
2-1)所有可信工厂将统一确定本地分布式训练子端LSTM故障诊断模型训练目标,即:
其中,n表示所有参与联合训练过程的可信工厂构建的数据集大小,表示d维的模型参数,R表示实数,是使用分布式训练子端LSTM故障诊断模型参数
2-2)将目标方程转化成:
其中,K是参与联邦学习的可信工厂数量,表示位于可信工厂k的数据点的索引集,表示的基数即集合的大小,表示在分布式训练子端LSTM故障诊断模型参数下计算私有数据集上的平均损失;
2-3)对于每家工厂k,,有
其中,t= 1,2, …表示每一轮的通信,表示每个可信工厂固定的学习率,表示在下计算私有数据集上的平均损失的梯度,表示第t轮分布式训练子端LSTM故障诊断模型参数,表示第k个可信工厂第t+1轮分布式训练子端LSTM故障诊断模型参数,表示使用分布式训练子端LSTM故障诊断模型参数对样本进行预测的损失的梯度;
2-4)将自然对数和诊断模型的损失loss纳入每个工厂本地模型参数向量的权重中来达到平衡目的,如下:
。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津开发区精诺瀚海数据科技有限公司,未经天津开发区精诺瀚海数据科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011291656.5/1.html,转载请声明来源钻瓜专利网。