[发明专利]基于变分自编码时序分解的时间序列异常检测方法和设备在审
申请号: | 202210290945.6 | 申请日: | 2022-03-23 |
公开(公告)号: | CN114626479A | 公开(公告)日: | 2022-06-14 |
发明(设计)人: | 李文中;王品皓;陆桑璐 | 申请(专利权)人: | 南京大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 南京泉为知识产权代理事务所(特殊普通合伙) 32408 | 代理人: | 许丹丹 |
地址: | 210023 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 编码 时序 分解 时间 序列 异常 检测 方法 设备 | ||
1.一种基于变分自编码时序分解的时间序列异常检测方法,其特征在于,包括以下步骤:
S1、对时间序列进行分解,保留时间序列中与异常检测相关的部分;
S2、将分解后的时间序列划分为一组定长的子时间序列;
S3、利用训练集数据进行异常检测模型训练,所述异常检测模型为循环变分自编码器模型,模型的编码器部分和解码器部分的第一层神经网络处理层均为LSTM层,模型生成隐变量分布参数的处理层为RNN层,所述训练集为每个时刻的数据均为正常数据的子时间序列;
S4、利用异常检测模型对训练集中子时间序列进行重构,计算子时间序列中最后时刻数据的重构误差,并将其作为异常分数,保存训练集对应的异常分数,利用基于密度的异常阈值选择算法计算异常阈值;
S5、将待检测时间序列分解并划分为子时间序列,输入异常检测模型进行重构,计算异常分数,若异常分数大于异常阈值,则判断当前输入的子时间序列中的最后时刻数据存在异常。
2.根据权利要求1所述的基于变分自编码时序分解的时间序列异常检测方法,其特征在于,所述步骤S1包括:根据时间序列是否具有周期性,利用STL方法或HP滤波法对时间序列进行分解,其中针对具有周期性的时间序列,采用STL方法对时间序列进行分解;针对不具有周期性的时间序列,采用HP滤波法对时间序列进行分解。
3.根据权利要求2所述的基于变分自编码时序分解的时间序列异常检测方法,其特征在于,针对具有周期性的时间序列,分解公式如下:
其中xt为时间序列t时刻的时序值,τt为时间序列经STL方法分解后t时刻趋势部分的时序值,st为季节性部分,rt为剩余部分,保留剩余部分rt并将其赋值给构成新的时间序列,用于后续的异常检测。
4.根据权利要求2所述的基于变分自编码时序分解的时间序列异常检测方法,其特征在于,针对不具有周期性的时间序列,分解公式如下:
HP滤波法将时间序列分解为两个组成部分:趋势部分τt和波动部分rt,保留趋势部分τt并将其赋值给构成新的时间序列,用于后续的异常检测。
5.根据权利要求1所述的基于变分自编码时序分解的时间序列异常检测方法,其特征在于,所述步骤S2对时间序列的划分过程如下:
为分解后的时间序列,w为子时间序列的长度,长度为n的时间序列划分成n-w+1个子时间序列。
6.根据权利要求1所述的基于变分自编码时序分解的时间序列异常检测方法,其特征在于,所述步骤S3中的循环变分自编码器模型的目标函数如下:
其中,w为子时间序列的长度,t表示t时刻,mse表示均方误差;表示变分自编码器生成的时间序列第t-w+i个数据,表示原始时间序列第t-w+i个数据,β表示调整权重的超参数,KL表示计算两个高斯分布的KL散度,qφ表示模型编码器部分,zt-w+i表示隐变量z的第t-w+i个数据,表示已知时间序列数据的前提下隐变量zt-w+i的条件概率分布,p(zt-w+i)表示隐变量zt-w+i的概率分布。
7.根据权利要求1所述的基于变分自编码时序分解的时间序列异常检测方法,其特征在于,所述步骤S4和S5异常检测中异常分数的计算过程如下:
D-R-VAE表示循环变分自编码模型,经过该模型对时间序列进行重构,重构的时间序列t时刻的时序值表示计算和的均方误差,ast表示t时刻的异常分数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京大学,未经南京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210290945.6/1.html,转载请声明来源钻瓜专利网。