[发明专利]一种基于LSTM的疲劳因子隐性异常检测及故障诊断方法有效
申请号: | 202010445803.3 | 申请日: | 2020-05-25 |
公开(公告)号: | CN111353482B | 公开(公告)日: | 2020-12-08 |
发明(设计)人: | 冯海领;焦正杉;孙敬哲;王汉奇;王向敏;赵宜斌 | 申请(专利权)人: | 天津开发区精诺瀚海数据科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04 |
代理公司: | 石家庄知住优创知识产权代理事务所(普通合伙) 13131 | 代理人: | 林艳艳 |
地址: | 300450 天津市滨*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 lstm 疲劳 因子 隐性 异常 检测 故障诊断 方法 | ||
1.一种基于LSTM的疲劳因子隐性异常检测及故障诊断方法,其特征在于,包括下述步骤:
S1.收集有关诊断对象目标设备的时序样本数据,样本中包含正常数据和异常数据以及异常数据的故障类型,使用EMD方法对设备的时序样本数据进行经验模态分解;
S2.提取时序样本数据中的正常数据样本,使用基于LSTM的深度神经网络构造设备震动信号预测模型;所述的基于LSTM的深度神经网络构造设备震动信号预测模型的流程包括以下步骤:
S2-1:特征工程:首先需要对收集到的原始数据进行处理,使用EMD经验模态分解及波形可视化技术进行辅助判断,通过观察IMF分量识别出异常震动频率;
S2-2:重采样:对原始数据重新采样,删除原始数据中的异常数据片段,确保留下来的数据中有且仅有连续的正常数据,规避非平衡数据带来的数据不平衡的问题;
S2-3:数据正规化:对时间序列中每一个维度的数据分别进行正规化处理,分别计算每一维度的均值μ和标准差σ,通过如下公式对时序样本数据X进行正规化,正规化后的数据为X′:
S2-4:生成数据集:将非监督数据集转换为监督数据集,将正规化后的数据划分成长度为l的连续时间序列Xr,Xr的长度由模型输入长度ls和输出长度lp共同决定,它们的关系为总长度l=ls+lp,将时序样本数据X划分为Xs和Xp两部分,作为模型的输入和输出样本;
S2-5:划分数据集:将数据随机排列,按相同比例划分输入数据Xs和输出数据Xp,得到训练数据集{Xtrain,ytrain}和验证数据集{Xval,yval};
S2-6:构建模型:设置检查点,每一Epoch保存一次模型参数,调整Epoch和Dropout参数,并观察trainloss和valloss,在出现过拟合情况时使用提早停止机制;
S2-7:使用模型进行预测:输入一段时序样本数据X,得到预测向量然后根据实际值y计算均方误差MSE,用来评估预测效果,n为序列数量:
S3.提取时序样本数据中的异常数据样本,使用基于LSTM的深度神经网络构造故障时序数据分类模型;
S4.将所述S2中获取的基于LSTM的震动信号预测模型的均方误差MSE作为初始疲劳因子阈值;
S5.使用基于LSTM的震动信号预测模型对设备生产数据进行预测,计算预测值与实际值的均方误差,将其均方误差与疲劳因子阈值对比用来检测异常信号,并根据实际情况动态调整疲劳因子阈值Δ;所述的使用基于LSTM的震动信号预测模型对设备生产数据进行预测具体为:
使用预测模型将时间点t的预测值计算出来,根据实际值y(t)计算预测误差:
其中i为真实监测值的维度,然后把每一个误差e(t)添加到预测误差的向量中:
h是用来评估当前误差的历史误差数量,ls为输入序列的长度,然后对这组误差e进行平滑处理,为在误差集合中选择一个误差阈值ε——在阈值以上的均方误差的值被归类为异常:
ε=μ(es)+zσ(es) (8)
ε为一组阈值误差的向量,es为序列误差向量,z为常数,μ为均值σ为标准差,其中ε由式(9)确定:
其中:
式(9)中的Eseq为ea∈ea的连续序列;
ε的估计值由z∈Z确定,Z是一组有序的正整数,表示大于μ(es)的标准偏差数,Z的值取决于实验数据,一旦argmax(ε)被确定下来,就可以为每一个产生均方误差的异常序列eseq∈Eseq进行打分,分数s用来表示异常的严重程度,即疲劳因子:
然后,每个异常误差序列中的最高均方误差根据其与所选阈值Δ的距离进行归一化;
所述的根据实际情况动态调整疲劳因子阈值Δ具体为:
创建一个新的集合emax,其中包含按降序排序的所有eseq的最大值max(eseq),然后把最大的非异常均方误差添加到emax末尾,这个序列逐步递减,第i步的降幅为:
如果在某一步i的降幅d(i)大于最小降幅p,所有满足的序列仍然是异常序列;如果降幅d(i)小于最小降幅p,那么后续所有误差的降幅都被重新分类为正常值;去掉异常序列后,再次重新计算留下的正常序列的均方误差,并作为调整后的疲劳因子阈值Δ;
S6.将异常信号通过故障时序数据分类模型进行分类,得到故障诊断结果。
2.根据权利要求1所述的基于LSTM的疲劳因子隐性异常检测及故障诊断方法,其特征在于,所述步骤S3中基于LSTM的深度神经网络构造故障时序数据分类模型的流程包括以下步骤:
S3-1:首先对设备的时序样本数据的故障数据样本进行处理,使用有异常并且已经确定故障类型的数据,另外再增加与每种故障样本相同数量的正常样本;
S3-2:对时序样本数据进行经验模态分解(EMD),得到含有IMF分量的m维向量imf={imf1,imf2,…,imfm},m大小由经验模态分解方式确定,imfi为第i维分量;
S3-3:对n类时序数据的imf进行编号,得到模型输入数据XC
根据编号确定模型的输出数据yC
S3-4:正规化数据,计算样本均值μ和标准差σ,正规化后的数据为X′C:
S3-5:划分数据集,将数据随机排列,按相同比例划分输入数据X′C和输出数据yC,得到训练数据集{Xtrain,ytrain}和验证数据集{Xval,yval};
S3-6:训练模型,设置检查点,每一Epoch保存一次模型参数,调整Epoch和Dropout参数,并观察trainloss和valloss,在出现过拟合情况时使用提早停止机制;
S3-7:使用模型进行分类,输入一段模型输入数据Xd,得到分类向量y′,则故障编号y′d=argmax(y′),通过编号找到对应的故障,argmax为最大值的参数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津开发区精诺瀚海数据科技有限公司,未经天津开发区精诺瀚海数据科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010445803.3/1.html,转载请声明来源钻瓜专利网。