[发明专利]一种基于归一化互信息估计的时间序列异常检测方法在审
申请号: | 201810052021.6 | 申请日: | 2018-01-19 |
公开(公告)号: | CN108491559A | 公开(公告)日: | 2018-09-04 |
发明(设计)人: | 孙磊;秦坤;蒋志宏;林大泳;聂青 | 申请(专利权)人: | 北京理工大学 |
主分类号: | G06F17/50 | 分类号: | G06F17/50;G06N99/00 |
代理公司: | 北京理工正阳知识产权代理事务所(普通合伙) 11639 | 代理人: | 王民盛 |
地址: | 100081 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 归一化 时间序列 异常检测 互信息 互信息估计 极限学习机 采样片段 样本点 最大熵 集合 数据挖掘技术 数据预处理 信息论 参数设置 参数寻优 算法模型 随机产生 循环步骤 阈值比较 准确率 算法 突变 保证 | ||
1.一种基于归一化互信息估计的时间序列异常检测算法,其特征在于:包括以下步骤:
步骤A.对待检测的时间序列进行数据预处理,得到M个与时间序列采样片段对应的样本点集合,初始化m=1;
步骤B.基于极限学习机对第m及第m+1个相邻采样片段对应的样本点集合进行互信息估计,求得第m对的互信息数值;
步骤C.将步骤B求得的第m对互信息数值利用最大信息熵进行归一化;
步骤D.m=m+1,并判断m是否等于M,并根据判断结果决定是否跳至步骤B,具体为:
D.1 若m小于M,则跳至步骤B;
D.2 否则,若m等于M,跳至步骤E;
步骤E 对生成的归一化互信息序列中的M-1个互信息数值与阈值进行比较,确定异常时间序列采样片段的位置;
至此,从步骤A到步骤E,完成了一种基于归一化互信息估计的时间序列异常检测算法。
2.根据权利要求1所述的一种基于归一化互信息估计的时间序列异常检测算法,其特征在于:步骤A中的数据预处理,又包括如下子步骤:
步骤A1.使用时间窗以固定的时延长度在时间序列上滑动;
步骤A2.利用步骤A1的时间窗对时间序列进行依次截取,将截取的每一个子序列中的样本点放入样本点集合当中,最后产生M个与时间序列对应的样本点集合。
3.根据权利要求2所述的一种基于归一化互信息估计的时间序列异常检测算法,其特征在于:步骤A1中的时间窗的长度是固定的;M等于待检测的时间序列的长度减去一个时间窗的长度后,再除以时延长度后的整数值。
4.根据权利要求1所述的一种基于归一化互信息估计的时间序列异常检测算法,其特征在于:步骤B又包括以下子步骤:
步骤B1.分别对第m及第m+1个样本点集合进行最大最小归一化,得到第m对样本点集合;
步骤B2.初始化极限学习机(ELM),具体为:
选择高斯核函数作为隐藏层核函数,设置隐藏层节点个数N;对于每个隐藏层的核函数,从步骤B1输出的第m对样本点集合中的任意的相同位置处选取一对样本点作为核宽,在区间(a,b)中任取一点作为核中心,对N个核函数进行初始化;
步骤B3.求解权重矩阵,具体为:
步骤B3.1 利用ELM估计联合概率密度与边缘概率密度乘积之比,即概率密度比;
步骤B3.2 通过使得ELM的输出与概率密度比的差值的期望值最小,利用样本平均取代期望值,求得ELM隐藏层至输出层的权重矩阵;
步骤B4.求得互信息数值,具体为:将步骤B3.2求得的权重矩阵代入ELM当中,利用样本平均代替期望求得互信息数值。
5.根据权利要求1所述的一种基于归一化互信息估计的时间序列异常检测算法,其特征在于:步骤C,具体包括如下子步骤:
步骤C1.根据最大熵原理,分别计算第m对样本点集合的最大熵;
步骤C2.将步骤C1输出的两个最大熵中数值较大的最大熵作为归一化因子,对第m对样本点集合的互信息进行归一化。
6.根据权利要求1所述的一种基于归一化互信息估计的时间序列异常检测算法,其特征在于:步骤E中,生成的归一化互信息序列是由执行M-1次步骤B和步骤C得出的归一化互信息值组成的集合;阈值是人为设定的数值。
7.根据权利要求1所述的一种基于归一化互信息估计的时间序列异常检测算法,其特征在于:步骤E,具体为:若某一个归一化互信息数值高于设置的阈值,则该数值对应的时间序列采样片段将视为一个发生突变的片段。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京理工大学,未经北京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810052021.6/1.html,转载请声明来源钻瓜专利网。