[发明专利]一种基于生成模型的LSTM多变量时间序列异常检测方法在审
申请号: | 202210887895.X | 申请日: | 2022-07-26 |
公开(公告)号: | CN115392109A | 公开(公告)日: | 2022-11-25 |
发明(设计)人: | 陈绍炜;温鹏飞;赵帅;徐芳达;陈雨含;王诗音 | 申请(专利权)人: | 西北工业大学 |
主分类号: | G06F30/27 | 分类号: | G06F30/27;G06F119/02 |
代理公司: | 西安凯多思知识产权代理事务所(普通合伙) 61290 | 代理人: | 范倩 |
地址: | 71007*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 生成 模型 lstm 多变 时间 序列 异常 检测 方法 | ||
1.一种基于生成模型的LSTM多变量时间序列异常检测方法,其特征在于,包括如下步骤:
步骤1:数据预处理,包括如下子步骤:
步骤1.1:数据标准化:
采用两种方法对不同特征集进行标准化,当传感器数据随时间变化时,采用零-均值规范化方法(即Z-Score标准化)进行标准化操作,对于序列x1,x2,…,xn,标准化转换公式如下:
此式中,和s分别为训练集变量的均值和标准差,由此得到标准化后新的序列数据y1,y2,…,yn。
当传感器数据恒定不变时,我们采用下式进行标准化操作:
步骤1.2:数据标签标定:
对于每一个待测设备,规定运行周期中的正常采样数据作为正常数据进行训练;根据先前工作研究所得出的数据集阈值先验知识,将检测出的退化变点以后的数据标记为异常,以此进行算法评估。
步骤1.3:数据集划分:
将待测设备数据集按合适的比例进行划分,对应得到其训练集、验证集、测试集;
步骤1.4:数据切片
采用滑动窗口的方法对数据集进行切片处理,将某个点的检测转化为对点所在区间的检测;
步骤2:DG-MTAD算法实现异常检测
步骤2.1:DG-MTAD算法模型训练
DG-MTAD算法模型由编码器E、生成器G以及3个鉴别器D1,D2,D3组成,生成器G实现隐空间中的随机噪声Z向真实样本数据空间中生成样本G(Z)的映射;编码器E将真实样本X编码为隐空间的高效表示E(X),从而实现不同空间下的双向学习过程。
在模型训练阶段,首先将真实序列数据输入到编码器E中,同时将隐空间中的随机噪声数据输入到生成器G中,然后将编码器E与生成器G的输入、输出结果分别进行组合,一同输入到鉴别器D1中进行判断,此外,算法模型中还增加了鉴别器D2和鉴别器D3,以实现对生成器和编码器输出结果的进一步约束。其中鉴别器D2的输入是生成器G的输出和真实样本X,鉴别器D3的输入是编码器E的输出样本和隐空间的随机噪声。通过多轮的对抗训练最小化鉴别器的输入数据差异,最终在获得足够敏感的鉴别器模型参数的同时,使得编码器与生成器能够生成与目标输出尽可能相似的数据来“欺骗”鉴别器。
DG-MTAD算法模型中一共采用了3个鉴别器,其中:
鉴别器1(D1)用于评估样本来自真实数据X而不是生成器G(Z)的可能性,将样本数据空间中的真实样本X与真实样本编码为隐空间的高效表示E(X)以及隐空间中的随机噪声Z与真实样本的生成样本G(Z)进行组合作为D1训练过程中的输入,通过如下的目标函数进行对抗训练:
鉴别器2(D2)用于评估G(E(X))与真实数据X的相似度,G(E(X))是将编码器E的输出输入到生成器G中进行重构,将真实样本数据X与随机噪声以及真实样本数据X和G(E(X))进行组合作为D2的输入,训练过程中D2的目标函数如下:
鉴别器3(D3)能够使得E(G(Z))与Z尽可能相似,E(G(Z))是对生成样本G(Z)编码后的隐空间表示,它的输入由随机噪声Z以及Z和E(G(Z))组成,D3目标函数如下:
因此,DG-MTAD算法模型的总体目标函数包含以上三个鉴别器的损失函数,具体定义如下:
式中,V(D1,E,G),V(D2,E,G),V(D3,E,G)分别为3个鉴别器对抗训练的目标函数。通过多轮对抗训练不仅训练好了鉴别器的参数,而且使得编码器和生成器生成与目标输出尽可能相似的数据,至此,完成了DG-MTAD模型的训练过程。
步骤2.2:异常检测实现
DG-MTAD算法模型中的异常检测部分是通过比较GAN模型中生成样本与真实样本的差异,利用正常类型的样本重构误差小而异常类型的样本重构误差大的原理实现的。将测试集样本输入到训练好的自编码器、生成器和鉴别器2模型中进行重构和鉴别,然后计算异常分数进行异常判断。DG-MTAD算法模型的异常分数计算由以下两部分组成:
(1)鉴别损失:
由通过如下式子表示异常分数中的鉴别损失:
Ldis=D2(Xtest) (6)
(2)生成损失:
生成损失的计算公式如下:
所以,DG-MTAD算法模型的异常分数计算公式如下:
其中,为鉴别损失的权重参数,用于调节鉴别损失与生成损失对异常分数的影响比例。将该值与模型训练过程中训练好的阈值θ进行比较,从而完成异常判定。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西北工业大学,未经西北工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210887895.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种低温低压氨回收工艺
- 下一篇:炮位侦察校射雷达最优跟踪重频的实时选择方法