[发明专利]一种基于CFSFDP聚类的并行自适应异常检测方法有效
申请号: | 201910215830.9 | 申请日: | 2019-03-21 |
公开(公告)号: | CN109995772B | 公开(公告)日: | 2021-06-15 |
发明(设计)人: | 任维武;底晓强;李锦青;毕琳;解男男 | 申请(专利权)人: | 长春理工大学 |
主分类号: | H04L29/06 | 分类号: | H04L29/06;G06K9/62 |
代理公司: | 长春众邦菁华知识产权代理有限公司 22214 | 代理人: | 王丹阳 |
地址: | 130022 吉林*** | 国省代码: | 吉林;22 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 cfsfdp 并行 自适应 异常 检测 方法 | ||
1.一种基于CFSFDP聚类的并行自适应异常检测方法,其特征是,该方法由以下步骤实现:
步骤一、输入网络数据点,并在所述输入的网络数据点中分别标注原有中心点Ccl,属于聚类但在原有中心点半径d外的点Ecl以及离散点D;删除原有中心点半径d内除了中心点Ccl外的所有点;C为中心点标识,cl为聚类标识,E为边缘点标识;
步骤二、实时输入新的网络数据点,并行计算新加入的数据点与步骤一中的网络数据点的距离;具体过程为:
计算新加入的数据点i到原有中心点Ccl的距离DT(i,Ccl),所述距离DT(i,Ccl)的降序序列为DSC;新加入的数据点i到属于聚类但在原有中心点半径d外的点Ecl的距离DT(i,Ecl),所述距离DT(i,Ecl)的降序序列为DSE;新加入点i到离散点D的距离DT(i,D),离散点的降序序列为DSD,其中DS为降序序列标识;
步骤三、判断新加入的数据点i是否在原有中心点半径d内,如果是,则原有中心点半径d内数据点的密度值加1;如果否,执行步骤四;
步骤四、检索降序序列DSE和离散点的降序序列DSD,生成所述新加入的数据点i的半径内数据点密度值ρ和新加入的数据点i到原有中心点距离DT(i,Ccl),根据所述密度值ρ和新加入的数据点i到原有中心点Ccl的距离DT(i,Ccl)生成新加入的数据点i选择因子序列DSr;
生成新加入的数据点i选择因子γi的计算公式为:
式中,ρi为i点的密度值,DTmin为到原有中心点距离DT(i,Ccl)中的最小距离,DTmax为到原有中心点距离DT(i,Ccl)中的最大距离,θ是选择系数,默认值为1;
步骤五、判断新加入的数据点i是否为新的中心点,如果否,则执行步骤六,如果是,执行步骤七;
所述判断新加入的数据点i是否为新的中心点时,根据步骤四中选择因子γi的阶跃度来判定,当阶跃度为1时,即为新的中心点,阶跃度的计算方式为:
STC=Sgn(γi-γi-1-κC)
式中,Sgn为单位阶跃函数,κC为中心点阶跃因子,γi-1是选择因子序列DSr中γi的前一个因子;
步骤六、判定新加入的数据点i是否为离散点,如果是离散点,加入离散点序列,标注为D;如果不是离散点,则判定新加入的数据点i属于哪个聚类,检索DSC序列的末尾,即距离该DSC序列的末尾最近的聚类为新加入的数据点i属于的聚类,找到新加入的数据点i的中心点及聚类信息;
所述新加入的数据点i如果是离散点,离散点的选择因子值存在一个阶跃,即它的值小于其他聚类点的值,当阶跃度为1时,即为离散点,阶跃度的计算方式为:
STD=Sgn(γi-γi-1-κD)
其中Sgn为单位阶跃函数,κD为离散点阶跃因子;
步骤七、扩大新的中心点的半径至边界,搜索新的中心点的半径外距离所述新的中心点最近点j,扩大中心点半径至最近点j,标注扩大后半径内所有点为cl,标注最近点j半径内所有的点为Nj,其中N为最近点标识;执行步骤八;
步骤八、判断是否存在属于最近点j半径内的点但不属于新的中心点扩大半径后半径内的点,如果存在,则继续扩大半径;如果不存在,停止扩大,保留密度ρ的值,删除新的中心点扩大半径后内的所有点。
2.根据权利要求1所述的一种基于CFSFDP聚类的并行自适应异常检测方法,其特征在于:所述聚类信息为聚类标识,中心点标识以及边缘点标识。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于长春理工大学,未经长春理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910215830.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于遗传算法的存储型XSS漏洞检测系统
- 下一篇:数据处理方法和装置