[发明专利]一种工业故障诊断非平衡时序数据扩充方法有效
申请号: | 202011352099.3 | 申请日: | 2020-11-27 |
公开(公告)号: | CN112328588B | 公开(公告)日: | 2022-07-15 |
发明(设计)人: | 沈继红;谭思超;雋兆波;戴运桃;王淑娟;梁源 | 申请(专利权)人: | 哈尔滨工程大学 |
主分类号: | G06F16/215 | 分类号: | G06F16/215;G06N3/04 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 150001 黑龙江省哈尔滨市南岗区*** | 国省代码: | 黑龙江;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 工业 故障诊断 平衡 时序 数据 扩充 方法 | ||
1.一种工业故障诊断非平衡时序数据扩充方法,其特征在于,包括以下步骤:
步骤1:准备训练数据集:将工业系统历史运行过程中的离线数据作为故障诊断的原始数据X,X中包含有n种类型的故障数据,其中存在m种大样本数据集分别为α1,α2… αm,n-m种小样本数数据集β1,β2… βn-m,并且小样本数据集和大样本数据中最大数量的不平衡比例IR小于给定值,然后以小样本类型故障数据集作为训练集,对数据进行归一化以及标准化预处理,得到所需训练数据集;
步骤2:构建改进的边界平衡生成对抗网络模型GRU-BEGAN,包括判别器D和生成器G,生成器G由门控循环神经网络GRU模型构成,判别器D是一个自编码器模型,门控循环神经网络通过使用自带反馈的神经元使得模型的输出和当前时刻相关同时也和上一时刻的输出相关,门控循环神经网络单元包含更新门和重置门,其中zt代表更新门、rt代表重置门,更新门控制历史隐含状态ht-1在当前隐含状态ht和当前候选状态之间的分配,重置门决定当前候选状态对历史隐含状态ht-1的依赖程度,门控循环神经网络的单元更新公式具体为:
rt=σ(Wxrxt+Whrht-1+br)
zt=σ(Wxzxt+Whzht-1+bz)
其中,xt为当前时刻的输入,Wxr,Whr,br为更新重置门的权重参数和偏置参数,Wxz,Whz,bz为更新更新门的权重参数和偏置参数,Wxh,Whh,bh为更新当前候选状态的权重参数和偏置参数,σ为sigmoid函数,zt为更新门、rt为重置门,ht为当前隐含状态,为当前候选状态;
步骤3:训练构建的GRU-BEGAN网络模型,具体包括:
步骤3.1:初始化参数:输入训练数据的批次batchsize、训练迭代次数epoch、超参数α,θ,λk,kt,分别是学习率、KL损失权值系数、kt更新的学习率、生成数据重构损失权值系数;
步骤3.2:训练判别器:将带有条件约束t的随机变量作为生成器的输入,生成器得到生成数据G(z|t),再将带有条件约束t的真实数据以及生成数据G(z|t)作为判别器的输入,计算判别器损失函数LD=L(x|t)-ktL(G(z|t)),根据Adam优化算法去更新判别器的权重参数:
w←w-α*Adam(w,dw)
kt+1←kt+λk(rL(x|t)-L(G(z|t)))
kt=min(max(k,0),1)
其中,kt表示生成数据重构损失的权重系数,λk为kt更新的学习率;表示属于t时间段内的原始数据,表示属于t时间段内的生成数据;L(x|t)和L(G(z|t))分别表示真实数据和生成数据的重构损失;
步骤3.3:训练生成器:将带有条件约束t的随机变量作为生成器的输入,生成器得到生成数据G(z|t),再将带有条件约束t的真实数据以及生成数据G(z|t)作为判别器的输入,计算生成器损失函数LG=L(G(z|t))+θLossfeature,根据Adam优化算法去更新生成器的权重参数:
w←w-α*Adam(w,gw)
其中,Lossfeature表示真实数据和生成数据潜在特征分布之间的KL散度,其数学表达式为:
Lossfeature=DKL(Encoder(x)||Encoder(G(x)))
步骤3.4:根据步骤3.2和步骤3.3交替训练判别器以及生成器,直到Mgloable损失函数值不再下降,网络模型收敛则训练完成,Mgloable损失函数具体为:
Mgloable=L(x|t)+||rL(x|t)-L(G(z|t))||1
其中,r用来表示多样性比率,用来调节生成器和判别器之间的平衡,计算公式为:
如果判别器和生成器达到平衡,则E(L(x|t))=E(L(G(z|t))),E(L(x|t))表示真实数据重构损失的期望,E(L(G(z|t)))表示生成数据重构损失的期望;
步骤4:根据训练好的GRU-BEGAN生成对抗网络模型生成小样本类型的人工数据:训练完成后的模型输入简单随机变量z|t,生成符合时间t的时序数据,再将生成的数据集扩充至原始数据的小样本类型中,根据扩充后的数据集建立1D/2D-CNN故障诊断模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工程大学,未经哈尔滨工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011352099.3/1.html,转载请声明来源钻瓜专利网。