[发明专利]一种云环境多指标无监督异常检测和根因分析方法有效
申请号: | 202210077012.9 | 申请日: | 2022-01-24 |
公开(公告)号: | CN114090396B | 公开(公告)日: | 2022-06-14 |
发明(设计)人: | 刘发贵;庄荣忠 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G06F11/30 | 分类号: | G06F11/30;G06K9/62 |
代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 江裕强 |
地址: | 510640 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 环境 指标 监督 异常 检测 分析 方法 | ||
1.一种云环境多指标无监督异常检测和根因分析方法,其特征在于,包括以下步骤:
S1、对云服务器中的多个时序指标数据进行数据的预处理,将预处理后的数据划分为训练集、验证集和测试集;
S2、采用基于堆叠自动编码器和K-Means聚类结合的方法剔除训练集中的异常数据簇,并为训练集其余的数据簇打上表示正常的伪正常标签;使用滑动窗口将训练集、测试集和验证集的数据进行样本划分,得到一定时间步长的子序列;
S3、根据步骤S2中进行样本划分后的训练集的样本数据训练基于LSTM网络的无监督异常检测模型;
S4、使用训练好的无监督异常检测模型对测试集的时序指标数据进行异常检测,得到异常概率,大于给定阈值的时序指标数据点为异常数据点,反之为正常数据点;并根据是否在异常区间开始后的不晚于T个时间点内检测到该异常区间的异常数据点,对异常区间进行标记;
S5、使用特征选择方法对异常区间中的多个变量计算权重,根据权重大小得到影响异常的指标。
2.根据权利要求1所述的一种云环境多指标无监督异常检测和根因分析方法,其特征在于,步骤S1中,数据的预处理包括缺失值处理和数据归一化处理;
所述缺失值处理为对多个时序指标数据中的空缺值进行人工填充和删除;对于某行或某列时序指标数据中的缺失值超过10个的,直接删除该行时序指标数据样本或者该列时序指标数据,而对于某行或某列时序指标数据中的连续缺失值不超过10个,选取同列中前后10个非缺失值的平均值进行填充;
所述数据归一化处理为使用归一化函数,使缺失值处理后的多个时序指标数据的值分布在[0,1]中,具体如下:
其中,Xnorm是归一化后的时序指标数据,X为时序指标数据,Xmax、Xmin为多个时序指标数据中的最大值和最小值。
3.根据权利要求1所述的一种云环境多指标无监督异常检测和根因分析方法,其特征在于,步骤S2包括以下步骤:
S2.1、采用堆叠自动编码器的方法逐层提取训练集中的时序指标数据的特征并降维,得到降维处理后的时序指标数据;
S2.2、采用K均值聚类算法对降维处理后的时序指标数据进行聚类,使得异常数据点聚合成一个数据簇,剔除数据量最少的数据簇,然后为剩余的数据簇打上表示正常的伪正常标签;
S2.3、采用滑动窗口将打上伪正常标签后的时序指标数据划分为给定时间步长的子序列,作为无监督异常检测模型的输入。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210077012.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:三维声源声场重构方法及系统
- 下一篇:一种异构联邦学习平台联通方法及装置