[发明专利]一种时序数据异常特征的挖掘系统及方法在审
申请号: | 201510551622.8 | 申请日: | 2015-09-01 |
公开(公告)号: | CN105205112A | 公开(公告)日: | 2015-12-30 |
发明(设计)人: | 鲍军鹏;樊恒海;杨天社;齐勇;张海龙;王小乐;高波;杨冬毅 | 申请(专利权)人: | 西安交通大学;中国西安卫星测控中心 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06K9/62 |
代理公司: | 西安通大专利代理有限责任公司 61200 | 代理人: | 徐文权 |
地址: | 710049 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 时序 数据 异常 特征 挖掘 系统 方法 | ||
1.一种时序数据异常特征的挖掘系统,其特征在于,包括数据预处理模块、自适应获取周期模块、获取特征向量模块、TK-Means聚类模块和特征字符串生成模块;
数据预处理模块,用于对原始时序数据进行清洗、插值处理,得到有效数据形式;
自适应获取周期模块,用于自动识别获取数据预处理模块预处理后数据中周期数据的最小完整周期值;
获取特征向量模块,用于对于周期数据按照其最小完整周期划分观察窗口,对于非周期数据按照指定值划分观察窗口,然后分别提取观察窗口的傅里叶特征、PCA特征、统计特征、小波近似特征和小波细节特征,构成5种类型的特征向量;
TK-Means聚类模块,用于对5种类型的特征向量分别进行TK-Means聚类,并将得到的聚类结果表示成特征字符;
特征字符串生成模块,用于根据聚类结果把观察窗口转换为对应特征向量所属簇的特征字符。
2.根据权利要求1所述的一种时序数据异常特征的挖掘系统,其特征在于,数据预处理模块包括去野值、生成单参数文件、等间隔处理以及归一化处理步骤;去野值的步骤包括:对每个数据设定上下限,把大于上限的数值变为上限,小于下限的数值变为下限,以此去野值;等间隔处理处理步骤中,默认对数据每隔1秒进行采样,等间隔处理后的数据,每分钟都从0秒开始,59秒结束;数据经过等间隔处理之后进行归一化处理,将其取值范围转换到[0,1]区间上。
3.根据权利要求1所述的一种时序数据异常特征的挖掘系统,其特征在于,自适应获取周期模块自动识别出时序数据的最小完整周期的步骤包括:首先设定一个观察窗口,然后该窗口向后滑动Δt时间得到一个新窗口,以此类推,得到N个窗口,每个窗口之间间隔Δt时间;然后每个窗口内的参数值构成该窗口向量,接着分别计算t+0时刻窗口向量与{t+Δt,t+2Δt,…,t+NΔt}时刻窗口向量之间的内积,得到内积值序列;然后对内积值序列进行傅里叶变换,求取傅里叶系数最大值所对应的频率,最后按照如下公式计算出数据的周期:
其中,C表示数据周期,N表示窗口个数,T表示采样间隔Δt,k表示最大傅里叶系数所对应的倍频数。
4.根据权利要求1所述的一种时序数据异常特征的挖掘系统,其特征在于,获取特征向量模块首先把时序数据划分成不相交的观察窗口,然后在每个观察窗口提取多种类型特征构成相应的特征向量;对于周期数据,取数据的最小完整周期作为窗口大小;对于非周期数据,指定一个固定值作为窗口大小;窗口特征包括傅里叶特征、PCA特征、统计特征、小波近似特征和小波细节特征;傅里叶特征由固定数目的傅里叶系数及其对应频率组成;观察窗口经过傅里叶变换后得到一系列傅里叶系数;忽略直流分量,选择前n个最大的傅里叶系数及其对应频率作为傅里叶特征;n取值为2;PCA特征由固定数目的PCA系数组成;观察窗口通过PCA变换,得到协方差矩阵,然后计算协方差矩阵的特征值和特征向量,选择前n个最大特征值及其对应特征向量,经过转换后得到PCA特征;统计特征由观察窗口内的如下4个值构成:[最大值,最小值,均值,方差];小波近似特征和小波细节特征都通过小波分解得到;根据数据自适应确定小波分解层数:小波分解层数L根据窗口大小k和阈值h自适应得到;阈值h是期望得到小波系数的最大长度;L初始为1,对于固定长度的窗口大小,如果k/2L小于阈值h,则分解层数为L,否则L加1,重复上述过程,直到k/2L小于阈值h;窗口数据通过L层小波分解后,得到相同长度的小波近似系数和小波细节系数;小波近似特征由小波近似系数组成,小波细节特征则由小波细节系数构成。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安交通大学;中国西安卫星测控中心,未经西安交通大学;中国西安卫星测控中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510551622.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种大数据犯罪同伙的筛查系统和方法
- 下一篇:一种物联网数据相似度处理方法
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置