[发明专利]一种时间序列特征提取方法无效
申请号: | 201310068261.2 | 申请日: | 2013-03-04 |
公开(公告)号: | CN103150364A | 公开(公告)日: | 2013-06-12 |
发明(设计)人: | 孔祥增;许力;陈丽萍;郑之;宋考 | 申请(专利权)人: | 福建师范大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 福州君诚知识产权代理有限公司 35211 | 代理人: | 戴雨君 |
地址: | 350007 *** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 时间 序列 特征 提取 方法 | ||
技术领域
本发明涉及时间序列,尤其涉及一种时间序列特征提取方法。
背景技术
时间序列是一种重要的高维数据类型,它是由客观对象的某个物理量在不同时间点的采样值按照时间先后次序排列而组成的序列,在经济管理以及工程领域具有广泛应用。例如证券市场中股票的交易价格与交易量、外汇市场上的汇率、期货和黄金的交易价格以及各种类型的指数等,这些数据都形成一个持续不断的时间序列。利用时间序列数据挖掘,可以获得数据中蕴含的与时间相关的有用信息,实现知识的提取。
发明内容
本发明的目的是提供一种适用于时间序列的异常检测的时间序列特征提取方法。
为实现上述目的,本发明采用以下的技术方案:
一种时间序列特征提取方法,其包括以下步骤:
步骤1:对一组时间序列数据D=<(x1,y1),(x2,y2),...,(xn,yn)>,进行光滑,以时间序列数据的时间变量的为X轴坐标,以随时间变量的增加而得到的变量为Y轴坐标;
步骤2:根据步骤1光滑的时间序列数据,将X轴划分成一个以上长度相等的域,在每个域内分别找出该域中Y值取得最大值或最小值的点,设定该点为极值点;
步骤3:将时间序列两端的端点与步骤2每个域中得到的极值点设定为特征点;
步骤4:根据步骤3得到的特征点将时间序列分成若干部分,相邻两个特征点之间形成一个特征区间,将相邻两个特征点连成直线,该直线与X轴的锐角夹角为θ,k=|tanθ|,k为该直线斜率的绝对值,k值越大,则表示该特征区间在Y轴方向上的信号强度和变化度越大;
步骤5:根据特征点划分时间序列片段的特征区间,提取Y轴方向上变化度大的区域。
本发明所述步骤1中,对一组时间序列数据进行光滑的具体操作为:
A)计算指定窗口内各个数据点的初始权重,权重函数一般表达为数值之间欧氏距离比值的立方函数;
B)利用初始权重进行回归估计,利用估计式的残差即估计值跟被估计值的差定义稳健的权函数,计算新的权重;
C)利用新的权重重复步骤2),不停的修正权函数,第N步收敛后可根据多项式和权重得到任意点的光滑值,所述N为20;
本发明所述步骤2中,所述的域为邻域,领域的长度为4的整倍数的偶数。
进一步,所述邻域的长度为8。
本发明所述步骤3中,根据时间序列D=<(x1,y1),(x2,y2),...,(xn,yn)>,如果点(xm,ym),1≤m≤n为步骤2得到的极值点,再选取参数点(xr,yr),1≤r≤n,将ym值与yr进行比较,若ym值大于yr,则保留该极值点(xm,ym)为特征点,若ym值小于yr,则舍弃该极值点。
根据以上的定义,将每个域中得到的极值点与选取的参数点的Y值进行比较。其中(xr,yr)是可控制选取的参数,可以根据时间序列的长度来自适应确定,yr值越大则被选中的特征点越少,时间序列被划分的段就越粗,反之,yr值越小,则被选中的特征点越多,时间序列被划分的段就越细。因此通过选择参数点(xr,yr),可以在不同程度的精细程度上进行数据挖掘。以上方法选取特征点的优点是可以选取到Y轴方向变化度大的一些点作为特征点,可以有效地识别Y轴方向上的变化。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于福建师范大学,未经福建师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310068261.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:搅拌主机合流槽装置
- 下一篇:一种2-(4-氟代苯甲酰基)苯甲酰胺的制备方法