[发明专利]一种时序数据异常特征的挖掘系统及方法在审
申请号: | 201510551622.8 | 申请日: | 2015-09-01 |
公开(公告)号: | CN105205112A | 公开(公告)日: | 2015-12-30 |
发明(设计)人: | 鲍军鹏;樊恒海;杨天社;齐勇;张海龙;王小乐;高波;杨冬毅 | 申请(专利权)人: | 西安交通大学;中国西安卫星测控中心 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06K9/62 |
代理公司: | 西安通大专利代理有限责任公司 61200 | 代理人: | 徐文权 |
地址: | 710049 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 时序 数据 异常 特征 挖掘 系统 方法 | ||
【技术领域】
本发明属于智能信息处理和计算机技术领域,具体涉及一种时序数据异常特征的挖掘系统及方法。
【背景技术】
时间序列数据有很多异常信息隐藏在数据表象之后,难以直接观察。需要从多角度提取时间序列数据的不同特征,从不同角度揭示时间序列数据中异常的本质。丰富的特征信息有助于更全面、更完整、更深刻地认识时间序列异常变化过程,有助于提升异常检测精确度,提高检测工具的泛化能力和适用性。这对于实时监控、故障诊断、快速预警/预报等系统具有重要作用。
时间序列异常变化都有一个发展过程。系统状态从正常到偏离再到异常,以及从轻度异常到重度异常甚至故障。整个演化过程中变化形式不同,特征也各不相同。分析这些不同形式特征的变化规律,学习出异常变化的特征规律对于完整认识时间序列数据状态的演变过程具有重要意义。
【发明内容】
本发明的目的在于提供一种时序数据异常特征的挖掘系统及方法,综合运用了聚类学习理论、统计学习理论、频谱分析理论、主成分分析理论和小波变换理论多种技术手段,从不同角度挖掘时间序列数据的潜在异常变化及其特征规律。
为了实现上述目的,本发明采用如下技术方案:
一种时序数据异常特征的挖掘系统,包括数据预处理模块、自适应获取周期模块、获取特征向量模块、TK-Means聚类模块和特征字符串生成模块;
数据预处理模块,用于对原始时序数据进行清洗、插值处理,得到有效数据形式;
自适应获取周期模块,用于自动识别获取数据预处理模块预处理后数据中周期数据的最小完整周期值;
获取特征向量模块,用于对于周期数据按照其最小完整周期划分观察窗口,对于非周期数据按照指定值划分观察窗口,然后分别提取观察窗口的傅里叶特征、PCA特征、统计特征、小波近似特征和小波细节特征,构成5种类型的特征向量;
TK-Means聚类模块,用于对5种类型的特征向量分别进行TK-Means聚类,并将得到的聚类结果表示成特征字符;
特征字符串生成模块,用于根据聚类结果把观察窗口转换为对应特征向量所属簇的特征字符。
本发明进一步的改进在于:数据预处理模块包括去野值、生成单参数文件、等间隔处理以及归一化处理步骤;去野值的步骤包括:对每个数据设定上下限,把大于上限的数值变为上限,小于下限的数值变为下限,以此去野值;等间隔处理处理步骤中,默认对数据每隔1秒进行采样,等间隔处理后的数据,每分钟都从0秒开始,59秒结束;数据经过等间隔处理之后进行归一化处理,将其取值范围转换到[0,1]区间上。
本发明进一步的改进在于:自适应获取周期模块自动识别出时序数据的最小完整周期的步骤包括:首先设定一个观察窗口,然后该窗口向后滑动Δt时间得到一个新窗口,以此类推,得到N个窗口,每个窗口之间间隔Δt时间;然后每个窗口内的参数值构成该窗口向量,接着分别计算t+0时刻窗口向量与{t+Δt,t+2Δt,…,t+NΔt}时刻窗口向量之间的内积,得到内积值序列;然后对内积值序列进行傅里叶变换,求取傅里叶系数最大值所对应的频率,最后按照如下公式计算出数据的周期:
其中,C表示数据周期,N表示窗口个数,T表示采样间隔Δt,k表示最大傅里叶系数所对应的倍频数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安交通大学;中国西安卫星测控中心,未经西安交通大学;中国西安卫星测控中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510551622.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种大数据犯罪同伙的筛查系统和方法
- 下一篇:一种物联网数据相似度处理方法
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置