[发明专利]一种基于归一化互信息估计的时间序列异常检测方法在审
申请号: | 201810052021.6 | 申请日: | 2018-01-19 |
公开(公告)号: | CN108491559A | 公开(公告)日: | 2018-09-04 |
发明(设计)人: | 孙磊;秦坤;蒋志宏;林大泳;聂青 | 申请(专利权)人: | 北京理工大学 |
主分类号: | G06F17/50 | 分类号: | G06F17/50;G06N99/00 |
代理公司: | 北京理工正阳知识产权代理事务所(普通合伙) 11639 | 代理人: | 王民盛 |
地址: | 100081 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 归一化 时间序列 异常检测 互信息 互信息估计 极限学习机 采样片段 样本点 最大熵 集合 数据挖掘技术 数据预处理 信息论 参数设置 参数寻优 算法模型 随机产生 循环步骤 阈值比较 准确率 算法 突变 保证 | ||
本发明涉及一种基于归一化互信息估计的时间序列异常检测方法,属于时间序列异常检测、信息论以及数据挖掘技术领域。包括A.数据预处理,得到与时间序列采样片段对应的样本点集合;B.基于极限学习机对每两个相邻采样片段对应的样本点集合进行互信息估计;C.将得到的互信息利用最大熵进行归一化;D.循环步骤B和C,得到归一化互信息序列,通过和阈值比较确定序列突变发生的位置。本发明描述的是一种不需要参数寻优的、无需训练的算法,其使用极限学习机进行互信息的估计,使用随机产生的参数设置,缩减了执行时间,保证了算法模型的执行效率;同时对估计出的互信息使用最大熵进行归一化,保证了异常检测的准确率。
技术领域
本发明涉及一种基于归一化互信息估计的时间序列异常检测方法,属于时间序列异常检测、信息论以及数据挖掘技术领域。
背景技术
时间序列的研究近年来逐渐受到重视,在临床医疗、军事、地质勘探和网络安全等领域广泛应用。时间序列的异常时间片段具有发生频率低、模式或统计特性较正常状态有显著差异等特点,往往包含着重要的信息,有研究的意义和价值。
经典的时间序列研究方法是基于时-频的信号检测方法,例如自相关法和循环相关法等,这些方法对于连续的信号可做到较好的特性描述,然而对于短时突变信号的检测效果欠佳。从统计角度出发,有CUSUM检验和广义似然比检验GLR等参数依赖的方法,该类方法认为信号的各阶统计特性都包含在其对应的概率密度函数当中,则可通过比较时间序列采样片段的概率分布来确定异常的发生。此外,一种近期兴起的检测方法是子空间方法,其通过使用预先设计的时间序列模型,运用主成份分析的方法可将相邻时间序列采样片段之间的差异性转化为子空间的距离进行描述,基于此的一个有效方法是Kawahara在2007年提出的子空间辨识方法,但上述方法缺陷在于都依赖于预置的参数模型,比如说自回归模型等,当信号的统计特性并不是非常明确时,比如突变信号的各个信号段之间或者噪声段之间的统计特性可能是时变的,甚至是无法测量的,这些方法将变得不适用。一些基于核函数的非参数突变点检测方法据此被提出,该类方法包括通过直接估计两相邻时间采样片段概率密度比的检测方法uLSIF模型以及基于uLSIF改进的RuLSIF模型等。然而这些方法在参数选择方面由于采用交叉验证的方法选取最优参数,会耗费了大量时间,计算成本较大。
因此,构建一种保证检测性能的同时尽量缩短检测时间,并且采用无参设置的时间序列异常检测算法具有较高的实用价值。
发明内容
本发明的目的在于针对现有时间序列异常检测算法在参数选择方面采用交叉验证方法选取最优参数导致耗费时间以及计算成本较大的技术缺陷,提出一种基于归一化互信息估计的时间序列异常检测算法。
一种基于归一化互信息估计的时间序列异常检测算法,包括以下步骤:
步骤A.对待检测的时间序列进行数据预处理,得到M个与时间序列采样片段对应的样本点集合,初始化m=1;
具体的,步骤A中的数据预处理,又包括如下子步骤:
步骤A1.使用时间窗以固定的时延长度在时间序列上滑动;
步骤A2.利用步骤A1的时间窗对时间序列进行依次截取,将截取的每一个子序列中的样本点放入样本点集合当中,最后产生M个与时间序列对应的样本点集合;
其中,步骤A1中的时间窗的长度是固定的;M等于待检测的时间序列的长度减去一个时间窗的长度后,再除以时延长度后的整数值;
步骤B.基于极限学习机对第m及第m+1个相邻采样片段对应的样本点集合进行互信息估计,求得第m对的互信息数值;
具体地,步骤B又包括以下子步骤:
步骤B1.分别对第m及第m+1个样本点集合进行最大最小归一化,得到第m对样本点集合;
步骤B2.初始化极限学习机(ELM),具体为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京理工大学,未经北京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810052021.6/2.html,转载请声明来源钻瓜专利网。