[发明专利]一种基于多尺度抽样的机电设备状态数据补全与预测方法有效
申请号: | 202010587623.9 | 申请日: | 2020-06-24 |
公开(公告)号: | CN111738420B | 公开(公告)日: | 2023-06-06 |
发明(设计)人: | 莫毓昌 | 申请(专利权)人: | 莫毓昌 |
主分类号: | G06N3/0475 | 分类号: | G06N3/0475;G06N3/094 |
代理公司: | 泉州市众创致远专利代理事务所(特殊普通合伙) 35241 | 代理人: | 汪彩凤 |
地址: | 321000 浙江省金华市婺*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 尺度 抽样 机电设备 状态 数据 预测 方法 | ||
1.一种基于多尺度抽样的机电设备状态数据补全与预测方法,其特征在于:包括如下步骤:
S1、采用智能传感器采集获取机电设备工作过程中的工况数据,构造工况数据集D,D中的故障样本数据集记为DF,D中的正常样本数据集记为DG;
S2、利用不同间隔跨度抽样的方法,从故障样本数据集DF抽取相应的子集,作为故障样本扩充数据集;其具体操作如下:
对于故障样本数据集DF={Z(t=1),Z(t=2),…,Z(t=n)},可以按照2的m次方提取故障样本数据集DF的子集DFm,作为故障样本扩充数据集,其中
DF0=DF={Z(t=1),Z(t=2),…,Z(t=n)}
DF1={Z(t=2),Z(t=4),…,}
DF2={Z(t=4),Z(t=8),…,}
…
DFm={Z(t=2的m次方),Z(t=2的m+1次方),…,}
S3、对各个故障样本扩充数据集,建立相应的生成式对抗网络模型,并进行样本补全,获得故障样本扩充补全数据集,其具体操作如下:
S31、构造生成式对抗网络模型,其中包括构造生成器网络、构造判别器网络和构造损失函数,具体操作如下:
S311、构造生成器网络:
生成器网络由2个隐藏层和一个输出层组成;
生成器网络的第1个隐藏层包含128个神经元,其计算过程为:
O1=ReLU(w1●x+b1);
其中x是生成器网络的输入;w1是权值矩阵,b1是偏置;O1是128维的输出向量;
生成器网络的第2个隐藏层包含64个神经元,其计算过程为:
O2=ReLU(w2●O1+b2);
其中O1是第1个隐藏层的输出向量,w2是权值矩阵,b2是偏置;O2是64维的输出向量;
生成器网络的输出层,计算过程为:
y=ReLU(w3●O2+b3);
其中O2是第2个隐藏层的输出向量,w3是权值矩阵,b3是偏置;y是维度和x相同的输出向量;
S312、构造判别器网络:
判别器网络由2个隐藏层和一个输出层组成;
判别器网络的第1个隐藏层包含128个神经元,其计算过程为:
O1=ReLU(w1●x+b1);
其中x是判别器网络的输入;w1是权值矩阵,b1是偏置;O1是128维的向量;
判别器网络的第2个隐藏层包含64个神经元,其计算过程为:
O2=ReLU(w2●O1+b2);
其中O1是第1个隐藏层的输出向量,w2是权值矩阵,b2是偏置;O2是64维的向量;
判别器网络的输出层,计算过程为:
y=sigmoid(w3●O2+b3);
其中O2是第2个隐藏层的输出向量,w3是权值矩阵,b3是偏置;y是单个概率输出值;
S313、构造损失函数:
首先,利用真实故障数据样本数据块,计算判别器网络的输出均值 ;
其中,x是真实故障数据样本,E是均值,D是判别器网络;
判别器网络对于判定为真实故障样本的样本输出为1;
判别器网络对于判定为假故障样本的样本输出为0;
所以该均值越大证明判别器网络越有效;
利用生成器生成的假故障数据样本数据块,计算判别器网络的输出均值;
其中,z为生成的假故障数据样本,z=G(seed),G是生成器网络,seed是从均值分布中随机抽样得到假故障数据样本种子;D是判别器网络;
判别器网络对于判定为真实故障样本的样本输出为1;
判别器网络对于判定为假故障样本的样本输出为0;
所以该均值越小证明判别器网络越有效;而该均值越大证明生成器网络越有效;
构造正则项H,用于抑制生成式对抗网络模型训练过程中梯度消失现象;
H=γ*;
其中,对任意生成的假故障数据样本z,xclosest是和z欧式距离最近的真实故障数据样本;
其中,D是判别器网络;
其中,γ是正则化常数,设置为10;
构造判别器网络损失函数LD;
LD=-+H;
其中,x是真实故障数据样本,E是均值,D是判别器网络;z为生成的假故障数据样本,z=G(seed),G是生成器网络,seed是从均值分布中随机抽样得到假故障数据样本种子;H是正则项;
构造生成器网络损失函数LG;
LG=-;
其中,z为生成的假故障数据样本,z=G(seed),G是生成器网络,seed是从均值分布中随机抽样得到假故障数据样本种子,D是判别器网络,E是均值;
S32、训练生成式对抗网络模型,其中包括如下步骤:
S321、从均值分布中随机抽样得到K个假故障数据样本种子,利用生成器网络生成的K个假故障数据样本,K设置为32,构成假故障数据样本数据块Dz;
S322、从故障样本扩充数据集中随机抽取K个真实故障样本,K设置为32,构成真实故障数据样本数据块Dr;
S323、利用Dz和Dr,基于损失函数LD,利用经典的梯度下降神经网络训练算法,训练对抗生成网络,特别的,训练时,固定生成器网络的参数不变,只更新判别器网络的参数;
S324、从均值分布中随机抽样得到K个假故障数据样本种子,利用生成器网络生成的K个假故障数据样本,K设置为32,构成假故障数据样本数据块Dz’;
S325、利用Dz’,基于损失函数LG,利用经典的梯度下降神经网络训练算法,训练对抗生成网络,特别的,训练时,固定判别器网络的参数不变,只更新生成器网络的参数;
S326、步骤S321-S324为一个训练周期,重复N个训练周期训练判别器网络和生成器网络之后,保存生成器网络参数,N设置为10000;
S33、利用训练完成的生成器网络,进行样本补全,获得故障样本扩充补全数据集,其具体操作如下:
S331、从均值分布中随机抽样得到L个假故障数据样本种子,利用训练完成的生成器网络生成的L个假故障数据样本,L可以设置为1000;
S332、从故障样本扩充数据集中随机抽取W个真实故障样本,从正常样本数据集中随机抽取2W个正常样本,合并构造训练数据集TR,W可以设置为100;
S333、分别构造5个传统的分类器模型,包括SVM模型、决策树模型、朴素贝叶斯模型、线性模型、3层神经网络模型;
S334、利用训练数据集TR对5个传统的分类器模型进行训练;
S335、利用训练好的5个传统的分类器模型对步骤S331中生成器网络生成1000个假故障数据样本进行选择,剔除低质量的假故障数据样本;
S336、剔除低质量的假故障数据样本之后留下的高质量假故障数据样本,并入各个故障样本扩充数据集,获得故障样本扩充补全数据集;
S4、构造多层神经网络,针对每个故障样本扩充补全数据集,利用相同的等距抽样方法,从正常样本数据集DG中抽样获得和故障样本扩充补全数据集中故障样本相同大小的正常样本,合并构造训练数据集TR,利用训练数据集TR训练多层神经网络模型作为机电设备健康状态预测模型,其中具体情况如下:
构造多层神经网络模型:
多层神经网络模型由2个隐藏层和一个输出层组成;
多层神经网络模型的第1个隐藏层包含128个神经元,其计算过程为:
O1=ReLU(w1●x+b1);
其中x是多层神经网络模型的输入,来自于训练数据集TR;w1是权值矩阵,b1是偏置;O1是128维的向量;
多层神经网络模型的第2个隐藏层包含64个神经元,其计算过程为:
O2=ReLU(w2●O1+b2);
其中O1是第1个隐藏层的输出向量,w2是权值矩阵,b2是偏置;O2是64维的向量;
多层神经网络模型的输出层,计算过程为:
y=sigmoid(w3●O2+b3);
其中O2是第2个隐藏层的输出向量,w3是权值矩阵,b3是偏置;y是单个概率输出值;
利用训练数据集TR,基于传统的BP算法训练多层神经网络模型,得到机电设备健康状态神经网络预测模型;
S5、实时采集机电设备的工况参数数据,输入训练好的机电设备健康状态预测模型,对机电设备健康状态进行预测判断,具体规则如下:
利用步骤S2中的不同间隔跨度抽样的方法,从采集的工况数据集DN中抽取相应的子集DN0,DN1,DN2,...,DNm;
利用训练好的m个多层神经网络模型,分别对输入数据DN0,DN1,DN2,...,DNm进行预测;
对预测结果进行多数表决,作为最终的机电设备健康状态预测结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于莫毓昌,未经莫毓昌许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010587623.9/1.html,转载请声明来源钻瓜专利网。