[发明专利]无监督聚类异常检测的方法有效
申请号: | 202010361681.X | 申请日: | 2020-04-30 |
公开(公告)号: | CN111612048B | 公开(公告)日: | 2023-03-10 |
发明(设计)人: | 袁线;李卫平;高宇;郭小红;程富强;付枫;周轩;张雷;王超;蔡立锋;张峻华;林海晨 | 申请(专利权)人: | 中国西安卫星测控中心 |
主分类号: | G06F18/23 | 分类号: | G06F18/23;G06F16/2458 |
代理公司: | 北京挺立专利事务所(普通合伙) 11265 | 代理人: | 韩畅 |
地址: | 710043 陕*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 监督 异常 检测 方法 | ||
1.一种无监督聚类异常检测的方法,其特征在于,所述方法包括,
对n个原始遥测数据第K个遥测数据建立等时间间隔第K个目标遥测数据序列,所述第K个目标遥测数据序列经过时标对齐获得第K个目标遥测数据;
所述第K个目标遥测数据序列经过时标对齐获得第K个目标遥测数据;为,判断所述第K个目标遥测数据的数据类型,按照所述第K个目标遥测数据序列的时标,在所述n个原始序列记录数据中获取所述第K个目标遥测数据,得到赋值后所述第K个目标遥测数据序列;
所述第K个目标遥测数据经过标准化处理后获得所述目标遥测数据的数据向量X,所述第K个目标遥测数据的数据向量X的各个分量进行时标对齐后,通过Single-Linkage聚类方法建模,获得聚类模型集S;
所述第K个目标遥测数据经过标准化处理为,采用Z-score方法进行标准化处理获得目标遥测数据集D;
所述第K个目标遥测数据集D至少一个所述目标遥测数据子集D′,与所述聚类模型集S之间的距离,获得所述第K个目标遥测数据的检测门限阈值;
所述第K个目标遥测数据的数据向量X到所述聚类模型集S中的每一个聚类的距离计算获得最小距离,所述最小距离超出所述检测门限阈值,所述第K个目标遥测数据为异常。
2.根据权利要求1所述的无监督聚类异常检测的方法,其特征在于,
对所述n个原始遥测数据第K个遥测数据建立等时间间隔第K个目标遥测数据序列前,
还包括,对所述n个原始遥测数据设定时间间隔td,建立等时间间隔采用获得所述第K个目标遥测数据序列x(t),设定所述第K个目标遥测序列起始时间ts,时间间隔td,tdte-ts,建立等时间间隔所述第K个遥测数据目标遥测序列;
{(t,x(t))|t=ts+p·td,p=0,1,2,…P-1},
x(t)表示对应t时刻第K个目标遥测数据
m为所述目标遥测数据序列长度,
floor函数表示向下取整。
3.根据权利要求2所述的无监督聚类异常检测的方法,其特征在于,
所述判断第K个目标遥测数据的数据类型,按照所述第K个目标遥测数据序列的时标,在所述n个原始序列记录数据中提取第K个目标遥测数据值,获得赋值后第K个目标遥测数据序列为;
判断所述第K个遥测数据的数据类型为离散型数据量的遥测数据时,按照所述n个原始遥测数据第K个遥测数据序列sk(t)记录中找到与所述第K个目标遥测数据时标最接近的时刻,获得所述第K个目标遥测数据,并得到赋值后的目标遥测序列;
判断所述第K个遥测数据的数据类型为连续型数据量的遥测数据时,按照所述n个原始遥测数据第K个目标遥测数据序列xk(t)的时标,在n个原始序列sk(t)记录中找到与所述第K个目标遥测数据时标最接近的前后5个时刻,采用拉格朗日插值法确定所述第K个目标遥测数据,并得到赋值后的所述第K个目标遥测数控序列。
4.根据权利要求3所述无监督聚类异常检测的方法,其特征在于,所述第K个目标遥测数据的数据中的K值小于n值,则令K=K+1,重新对所述第k个目标遥测数据建立等时间间隔所述第k个目标遥测数据序列;否则循环处理。
5.根据权利要求4所述无监督聚类异常检测的方法,其特征在于,所述第K个目标遥测数据采用Z-score方法进行标准化处理获得第K个目标遥测数据集D;
其中,采用Z-score方法,公式
其中,均值为
标准差为
其中x′ij为标准化后的变量值,xij为实际变量值;
采用随机抽样的方法将所述第K个数据集D划分为两个互斥的数据集D1和D2,满足D1∪D2=D,其中为空集。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国西安卫星测控中心,未经中国西安卫星测控中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010361681.X/1.html,转载请声明来源钻瓜专利网。