[发明专利]一种基于局部向量点积密度的数据流异常检测方法有效
申请号: | 201810293188.1 | 申请日: | 2018-03-30 |
公开(公告)号: | CN108667684B | 公开(公告)日: | 2021-04-30 |
发明(设计)人: | 首照宇;邹风波;田浩;文辉;张彤;赵晖;莫建文;程夏威;汪延国;曾情;卢先英 | 申请(专利权)人: | 桂林电子科技大学;桂林宇辉信息科技有限责任公司 |
主分类号: | H04L12/26 | 分类号: | H04L12/26;H04L29/06 |
代理公司: | 桂林市华杰专利商标事务所有限责任公司 45112 | 代理人: | 刘梅芳 |
地址: | 541004 广西*** | 国省代码: | 广西;45 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: |
本发明公开了一种基于局部向量点积密度的数据流异常检测方法,其特征是,包括如下步骤:1)对实时数据流进行处理;2)设置滑动窗口W中数据集S |
||
搜索关键词: | 一种 基于 局部 向量 密度 数据流 异常 检测 方法 | ||
【主权项】:
1.一种基于局部向量点积密度的数据流异常检测方法,其特征是,包括如下步骤:1)对实时数据流进行处理:对数据采集终端采集的各式各样的实时数据流进行处理,数据采集终端采集的数据以流的形式缓存,并将缓存的数据划分成大小均为n的数据块E0,E1,E2,.....,.每一个数据块代表一个基础窗口,每个滑动窗口W包含2个基础窗口,采用基础窗口和滑动窗口W相结合,实现数据的插入和删除;2)设置滑动窗口W中数据集Sm并初始化参数n,ε,λ:利用步骤1)获取的数据块,得到当前滑动窗口W中数据集Sm:设Sm={X1,X2,...,XN},由ε个数据块组成,总共包含N个数据点,N=ε·n,每个数据点根据其属性表示为
其中n表示每个数据块包含的数据点数,ε表示每个滑动窗口W包含的数据块个数,λ表示多重验证次数;3)获取向量点积均值MVP:根据步骤2)中得到的m维数据集Sm={X1,X2,...,XN},其中共有N个数据点,假设数据集中任意三个点A,B,C∈Sm(A=(XA1,…,XAm),B=(XB1,…,XBm),C=(XC1,…,XCm)),以A为起始点,构成向量
则点A关于数据集Sm的向量点积均值表示为MVP(A),当前滑动窗口W中每个数据点相对于该窗口中所有数据点的向量点积均值MVP,计算公式为公式(1):
其中,
表示点A与数据集中其它数据点之间所构成不重叠向量点积的总数;4)确定当前滑动窗口W中数据集Sm的最佳邻域半径r及r邻域:最佳邻域半径r是由有序4‑dist曲线图中的谷底点对应的4‑dist值,即在4‑dist曲线图中找出“谷底点”,并把“谷底点”与其第4最近邻点之间的距离确定为当前滑动窗口W中数据集的最佳邻域半径r,r邻域是指在维度为m的数据集Sm中的某点p的r邻域,其由与该点p之间的距离小于最佳邻域半径r的数据点组成,r邻域可用Nr(p)表示,r邻域计算公式为公式(2):Nr(p)={q∈Sm|dist(p,q)≤r} (2);5)获取各数据点的局部向量点积密度LDVP:根据步骤3)中所得的向量点积均值和步骤4)中所得的r邻域计算当前滑动窗口W中每个数据点p的局部向量点积密度LDVP,计算公式为公式(3):
6)确定当前滑动窗口中的候选异常点:对步骤5)得到的各数据点的局部向量点积密度LDVP进行降序排序,并采用基于最大斜率的异常判决准则,先确定出临界候选异常点,然后将当前滑动窗口W中所有局部向量点积密度小于该临界候选异常点LDVP值的数据点确定为候选异常点;7)多重验证得到确定异常点:对步骤6)中得到的所有候选异常点进行多重验证,并将经过3次验证仍表现为异常的候选异常点判决为确定异常点并输出保存。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于桂林电子科技大学;桂林宇辉信息科技有限责任公司,未经桂林电子科技大学;桂林宇辉信息科技有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810293188.1/,转载请声明来源钻瓜专利网。