[发明专利]一种时间序列数据特征提取及分类方法在审
申请号: | 202110601941.0 | 申请日: | 2021-05-31 |
公开(公告)号: | CN113297439A | 公开(公告)日: | 2021-08-24 |
发明(设计)人: | 陈靖;林祺;王德昊;郭永该;郭宇 | 申请(专利权)人: | 中电福富信息科技有限公司 |
主分类号: | G06F16/903 | 分类号: | G06F16/903;G06F16/906 |
代理公司: | 福州君诚知识产权代理有限公司 35211 | 代理人: | 彭东 |
地址: | 350000 福建省福州*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 时间 序列 数据 特征 提取 分类 方法 | ||
本发明公开一种时间序列数据特征提取及分类方法,首先对时间序列数据进行数据规整处理,使数据点之间具有相同的时间间隔;规整后的时间序列数据剔除时间序列数据中存在的异常点;对于时间序列数据中原本存在的缺失值及被剔除的异常值进行数据补充,对时间序列数据作简单移动平均;对简单移动平均后的时间序列数据做平稳性校验,以此判断时间序列数据特征是否为平稳或是波动;按照设定的周期长度切分数据;将相邻的两个时间序列数据段两两做皮尔逊相关系数计算,得到皮尔逊相关系数数组,取数组中的中位数为最终的相关系数,当相关系数大于或等于阈值,则判定该时间序列具有相应的周期性质;根据提取到的数据特征对时间序列数据进行分类。本发明提高了时间序列数据异常检测的准确性。
技术领域
本发明尤其涉及一种时间序列数据特征提取及分类方法。
背景技术
目前在时间序列数据异常检测方面已有许多成熟的异常检测算法,但是异常检测算法大多不具有普适性,同一种检测算法在面对不同类型的时间序列数据时,检测准确性往往大相径庭。所以亟待提出一种能够提取时间序列数据的特征并加以分类的方法,使得可以根据时间序列数据的不同类型选取最佳的异常检测算法,以达到提高异常检测准确度的目的。
发明内容
本发明的目的在于提供一种时间序列数据特征提取及分类方法。
本发明采用的技术方案是:
一种时间序列数据特征提取及分类方法,其包括以下步骤:
步骤1,首先对时间序列数据进行数据规整处理,使数据点之间具有相同的时间间隔;
步骤2,规整后的时间序列数据剔除时间序列数据中存在的异常点,以降低异常数据对于时间序列数据所属类型判别所造成的影响;
步骤3,对于时间序列数据中原本存在的缺失值及被剔除的异常值进行数据补充,
步骤4,对时间序列数据作简单移动平均,以削弱短期的偶然因素引起的数据波动;
步骤5,对简单移动平均后的时间序列数据做平稳性校验,以此判断时间序列数据特征是否为平稳或是波动;
步骤6,按照设定的周期长度(1天/周/月)切分数据;将相邻的两个时间序列数据段两两做皮尔逊相关系数计算,得到皮尔逊相关系数数组,取数组中的中位数为最终的相关系数,当相关系数大于或等于阈值,则判定该时间序列具有相应的周期性质;
步骤7,根据提取到的数据特征对时间序列数据进行分类,便于进行进一步的数据分析。
进一步地,作为一种较优实施方式,步骤2使用三倍标准差方法剔除时间序列数据中存在的异常点。
进一步地,作为一种较优实施方式,步骤3中数据补充使相同时间长度下的时间序列数据具有相同的数据点数,便于对时间序列数据进行特征提取处理。
进一步地,作为一种较优实施方式,步骤3中数据补充方法选用拟合样条或插值。
进一步地,作为一种较优实施方式,步骤6中阈值取值为0.6,即当相关系数大于或等于0.6时,则判定该时间序列具有相应的周期性质。
本发明采用以上技术方案,具有如下优点:1)可替代传统人工依靠自身经验对数据特征进行判断,提高工作效率;2)高效快速的提取分类时间序列数据的特征,对于异常检测算法的选取工作提供了很大的帮助;3)通过提取到的数据特征对数据加以分类,可以高效的处理大批量的时间序列数据,对特征提取后的数据分析工作提供了很大的帮助。
附图说明
以下结合附图和具体实施方式对本发明做进一步详细说明;
图1为本发明一种时间序列数据特征提取及分类方法的流程示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图对本申请实施例中的技术方案进行清楚、完整地描述。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中电福富信息科技有限公司,未经中电福富信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110601941.0/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置