[发明专利]一种基于区间划分的基站数据异常检测方法有效
申请号: | 201911329988.5 | 申请日: | 2019-12-20 |
公开(公告)号: | CN111079089B | 公开(公告)日: | 2023-08-11 |
发明(设计)人: | 刘海波;廖闻剑;卢山;张俊杰;张坤 | 申请(专利权)人: | 南京烽火星空通信发展有限公司 |
主分类号: | G06F17/18 | 分类号: | G06F17/18;G06F16/29 |
代理公司: | 南京经纬专利商标代理有限公司 32200 | 代理人: | 唐惠芬 |
地址: | 210019 江苏省南京市建*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 区间 划分 基站 数据 异常 检测 方法 | ||
1.一种基于区间划分的基站数据异常检测方法,其特征在于,所述方法包括以下步骤:
步骤(1)、对原始轨迹数据集预处理,将处理后数据集划分为动态区间和静态区间;所述动态区间表示为任意多个连续的近邻孤立点的下标构成的范围,所述静态区间表示为原数据集中除去所有动态区间,所剩各数据片段的起止下标构成的范围;
包括:
101、孤立点选取,令指定时间范围内仅出现一次的数据作为孤立点,表达公式如下:
其中,lt=(lont,latt)表示某个时刻t的空间位置,由该时刻的经度lon和纬度lat组成,表示以时刻ti为中心时刻的时间片段;
如果则lt为孤立点;
102、动态区间搜索,设定任意多个连续的近邻孤立点的起止下标构成的范围称为动态区间:
上式表示两个孤立点lx,ly的近邻关系,其中index(lt)表示孤立点lt在原始数据集中的索引下标,则lx,ly近邻当且仅当对于多个孤立点组成的集合L={l1,l2,l3…li}中任意子集如果则称L为i-近邻孤立点集;
近邻孤立点集的起止元素的下标组成的范围为动态区间,表示为I=[index(l1),index(li)];
103、静态区间生成,在预处理结果集的下标范围内,除去所有的动态区间,剩下的所有区间称为静态区间;
令原始数据集下标区间S=[0,n],假定动态区间I1=[i,i+k],I2=[j,j+u],其中k,u>0,i>0,j>i+k,j+u<n,则区间J1=[0,i-1],J2=[i+k+1,j-1],J3=[j+u+1,n]称为静态区间;
步骤(2)、模型求解,对所述动态区间使用多维高斯模型和滑窗距离模型进行异常点提取;对所述静态区间使用重心距离评分法进行异常点提取;
其中,所述动态区间的模型求解包含以下步骤:
201、提取数据样本的经度、纬度、提取时间、位置切换速率四个维度代入高斯模型计算整个数据集中各项数据的概率密度,对概率值进行从小到大排序,选取前λ个概率值对应的数据加入异常点候选集E1,多维高斯模型的计算公式如下:
其中,μ为N维均值向量,∑为N×N协方差矩阵,|∑|为∑的行列式;
202、建立滑窗距离模型,在预处理结果集上选取任意连续并且大小为2k+1的数据W=wi-k,…,wi-1,wi,wi+1,…,wi+k作为一个窗口,其中wi为窗口W的中心,wup=wi-k,…,wi-1表示长度为k的上半窗,wdown=wi+1,…,wi+k表示长度为k的下半窗,令R(wi,wup)表示中心点wi与上半窗wup的关联关系,表示为:
其中,distance(wi,wi-1)表示窗口中心wi和上文信息wi-1的欧式距离,表示上半窗wup中任意两位置距离的最大值;δ表示关联阈值;
则窗口中心wi与上半窗wup相关当且仅当R(wi,wup)=1;
令R(wi,wdown)表示中心点wi与下半窗wdown的关联关系,表示为:
其中,distance(wi,wi+1)表示窗口中心wi和下文信息wi+1的欧式距离,表示下半窗wdown中任意两位置距离的最大值;
则窗口中心wi与下半窗wdown相关当且仅当R(wi,wdown)=1;
将在预处理结果集上寻找异常点的过程转换成将窗口W以固定步长Step平移,寻找符合条件R(wi,wup)=0∩R(wi,wdown)=0的窗口中心的过程,将该窗口中心点加入异常点候选集E2;
使用重心距离评分方法对静态区间进行异常点求解,包括以下步骤:
203、重心点选取,令M表示静态区间J内所有数据的集合,则L′={l|l∈M,freqM(l)>γ}表示集合M中出现频次大于阈值γ的位置数据,其中freqM(l)表示位置l在集合M中出现的频次,采用加权平均的方式求区间重心点O,表示为:
其中,表示权重,为位置li的经度,为位置li的纬度,n为L′中元素个数;
204、距离评分计算,令distance(lx,ly)表示任意两个位置的距离,则集合L中任意元素与重心点距离的最大值称之为距离半径,表示为
进而对于集合M中任意数据m的评分scorem表示为:
则静态区间异常点候选集E3={m|m∈M,scorem=1};
步骤(3)使用五元组表示动态异常点和静态异常点,构成五元组集合表示异常点集;
所述步骤(3)具体包括以下步骤:
301、将动态区间求解得到的异常点候选集E1和E2做交集,其中相同的元素提取为异常点;
302、静态区间求解得到的异常点候选集E3中元素即为异常点;
303、定义五元组Error=[Account,lon,lat,Cptime,ErrFlag]表示上述提取的异常点,其中ErrFlag表示异常点类型,ErrFlag=0表示动态异常点,ErrFlag=1表示静态异常点。
2.如权利要求1所述的一种基于区间划分的基站数据异常检测方法,其特征在于,步骤(1)中所述预处理的规则为:清洗数据中不包含预先设定的字段的数据;对清洗后的数据进行去重,并按时间排序。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京烽火星空通信发展有限公司,未经南京烽火星空通信发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911329988.5/1.html,转载请声明来源钻瓜专利网。