[发明专利]基于图预测网络和自动编码器的异常检测方法及系统在审
申请号: | 202211377858.0 | 申请日: | 2022-11-04 |
公开(公告)号: | CN115713670A | 公开(公告)日: | 2023-02-24 |
发明(设计)人: | 顾磊;张孚容 | 申请(专利权)人: | 南京邮电大学 |
主分类号: | G06V10/774 | 分类号: | G06V10/774;G06V10/764;G06V10/74;G06N3/04;G06N3/08 |
代理公司: | 南京经纬专利商标代理有限公司 32200 | 代理人: | 陈月菊 |
地址: | 210046 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 预测 网络 自动 编码器 异常 检测 方法 系统 | ||
本发明公开了一种基于图预测网络和自动编码器的异常检测方法及系统,所述方法包括:对收集到的时间序列数据进行预处理,构建数据集;对构建的数据集进行时间依赖性处理;经过时间依赖性处理的时间序列数据集,通过图形结构学习传感器节点依赖性,得到重构时间序列数据集;将重构数据集送入图预测网络进行训练,得到预测重构数据;利用预测重构数据与观测数据误差计算异常分数,并基于异常分数计算各滑动窗口对应的阈值;将滑动窗口异常分数与对应的阈值来进行异常判别。本发明能够快速有效的学习时间序列中各个传感器的依赖性,同时能够学习时间序列数据对时间的依赖性,共同有效提高时间序列数据异常检测的性能。
技术领域
本发明属于异常检测技术领域,更具体地说,涉及一种基于图预测网络和自动编码器的异常检测方法及系统。
背景技术
工业自动化、连接技术、互联网应用现今快速发展,信息系统生成的数据几乎呈几何倍数增长,从庞大的产生数据中获取有价值的信息成为数据挖掘中重要研究方向。在工业系统中,从各网络物理系统的互联网设备中收集到大量时间序列数据,诊断出异常状态并发现异常原因;在信息安全邻域中,由异常检测技术发现潜在异常网络流量浮动、恶意攻击、非法操作等异常行为;在医疗领域中,心电图的骤变以及检查报告片异常部位的识别等;在金融领域中,异常检测技术多用于欺诈性的信用卡以及欺诈信用卡的使用等行为。异常检测技术应用广泛,因此,快速准确的异常检测技术至关重要。
异常检测方法一般分为两类,一类是经典传统的异常检测方法,包括基于线性模型的方法、基于距离的方法、支持向量机的方法、基于密度的方法。然而,目标系统变的更大和复杂,传统的异常检测方法具有局限性;另一类异常检测方法则是基于深度学习技术进行异常检测,深度学习技术具有强大的表征学习能力,在计算机视觉、自然语言处理等均有领域涉及,并且能够处理高维数据、时间序列数据、空间数据都有着优异的表现,逐渐成为时间序列异常检测技术的首选。因此,充分利用深度学习技术学习时间序列数据的特征,从不同的维度进行特征提取,使能够高效准确的识别出异常。
发明内容
为了解决上述技术问题至少之一,根据本发明的一方面,提供了一种基于图预测网络和自动编码器的异常检测方法,包括如下步骤:
S1、对时间序列数据进行划分操作,获得以传感器为索引的三维时间序列数据集X;
S2、将所述的三维时间序列数据集X,经过自动编码器以及注意力网络对数据集进行时间依赖性学习,得出得到重构数据集X1;
S3、基于所述重构数据集X1,经过图形结构学习得出关系矩阵A;
S4、基于重构数据集X1和关系矩阵A,经过图预测网络处理得到重构数据集S;
S5、基于所述三维时间序列数据集X与重构数据集S,计算误差与异常分数;
S6、基于异常分数计算每个批量对应的阈值ε;
S7、将异常分数与对应的阈值ε比较,判断异常。
进一步的,步骤S1中:
三维时间序列数据集X(t)为对原始时间序列数据Г进行归一化处理以及下采样处理后得到的数据集。
进一步的,步骤S1中:
原始时间序列数据Г={W1,W2,…,WT},T表示时间序号,其中每个Wt表示时间序列中t时刻对应的数据,是一个n维的向量,n表示维度的大小,选用最大最小标准化方法的归一化处理:
在完成原始数据Г的归一化后,再对归一化的时间序列数据下采样处理,对原始数据每10秒进行一次采样:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211377858.0/2.html,转载请声明来源钻瓜专利网。