[发明专利]一种多元时间序列基于傅里叶系数符号化类别集生成方法在审
申请号: | 201810271174.X | 申请日: | 2018-03-29 |
公开(公告)号: | CN108595528A | 公开(公告)日: | 2018-09-28 |
发明(设计)人: | 张可;柴毅;李媛;赵晓航;游丹妮 | 申请(专利权)人: | 重庆大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/14 |
代理公司: | 北京众合诚成知识产权代理有限公司 11246 | 代理人: | 胡柯 |
地址: | 400044 重*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 傅里叶系数 时间序列 时间序列数据 符号化 近似 降维 聚合 离散傅里叶变换 预处理 符号化表示 标准序列 分段聚合 分段数据 分段信息 高斯分布 欧氏距离 不变性 方差 高维 频域 算法 分段 过滤 保留 | ||
本发明公开了一种多元时间序列基于傅里叶系数符号化类别集生成方法,它包括:获取多元时间序列数据;对多元时间序列数据进行预处理,获得具有高斯分布的均值为0且方差为1的标准序列;采用分段聚合近似表示算法对多元时间序列进行分段,获取各序列的分段信息;将各序列的分段数据分别进行离散傅里叶变换,得到由傅里叶系数表示的序列段内的趋势特征;采用符号聚合近似表示方法对多元时间序列的序列段进行符号化表示,每个序列段所对应的符号和傅里叶系数即为该序列段完整的符号化类别集。本发明取得的有益效果是:可以将高维、海量的多元时间序列数据进行降维,保留符号聚合近似的优点;通过频域过滤方法进行降维保持欧氏距离的不变性。
技术领域
本发明涉及时间序列的数据挖掘技术领域,特别是一种多元时间序列基于傅里叶系数符号化类别集生成方法。
背景技术
针对时间序列数据的数据量大、海量性、复杂性、高维性等特点,已有分类、聚类、相似性查询、异常检测、模式挖掘等方面的研究,在金融、工业、气象、交通、互联网等领域有着广泛的应用。但大多数研究都是对一元时间序列数据进行分析,多元时间序列的研究还比较少。多元时间序列时间序列数据中,如何有效地提取多元时间序列数据特征,通过降维后分析其中蕴含的信息和知识,对科学研究和实际应用都具有重要的理论意义和现实意义。
传统的时间序列数据符号化方法(Symbolic Aggregate Approximation,SAX)首先要通过分段聚合近似表示方法(Piecewise Aggregate Approximation,PAA)实现分段求均值。然后根据正态分布将每个分段的均值数据转换为字符表示。SAX在时间序列数据降维与特征提取方面虽然简便高效,但是SAX算法均取各子序列段中的均值来符号化。因此不可避免会产生一些局限,即:SAX对子序列段的信息描述不够精准,难以反映子序列段内数据更细微的特征,如极大、极小值和统计特征与趋势特征等。这些局限性限制了其在具有明显形态特征的序列数据中的应用。如金融时间序列数据分析常有变化趋势的要求,复杂工业过程的流数据的趋势变化也在过程状态检测中占有重要的地位。因此,SAX只能近似的描述时间序列数据的大致特征。
缺点:当前符号化的时间序列数据表示由于只提取自序列段均值,存在难以描述分段内数据变化趋势等特征提取问题。因此亟需一种能表征分段内趋势特征的多元时间序列数据符号化算法。
发明内容
有鉴于现有技术的上述缺陷,本发明的目的就是提供一种多元时间序列基于傅里叶系数符号化类别集生成方法,克服了经典符号化表示算法的缺点,使用傅里叶逆变换后,保留的时域时间序列将变得更加平滑,从而达到去噪的效果。仅使用频域数据表示傅里叶变换时,对高频数据的过滤即为降维的过程;实现了具有分段趋势特征的符号化表示方法。
本发明的目的是通过这样的技术方案实现的,一种多元时间序列基于傅里叶系数符号化类别集生成方法,它包括有:所述方法步骤如下:
S1:获取多元时间序列数据;
S2:对多元时间序列数据进行预处理,获得具有高斯分布的均值为0且方差为1的标准序列;
S3:采用分段聚合近似表示算法对多元时间序列进行分段,并获取各序列的所有分段信息;
S4:将各序列的分段数据分别进行离散傅里叶变换,得到由傅里叶系数表示的序列段内的趋势特征;
S5:采用符号聚合近似表示方法对多元时间序列的序列段进行符号化表示,每个序列段所对应的符号和傅里叶系数即为该序列段完整的符号化类别集。
进一步,所述步骤S2中对多元时间序列进行预处理的具体步骤如下:
S21:设多元时间序列为分别有n个观测值的m个独立的时间序列组成,式中,Xi表示第i条原始时间序列,xij表示第i条时间序列在j时刻的原始观测值数据大小):计算各个序列数据的均值和标准差
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆大学,未经重庆大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810271174.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种融合多源异构信息的个性化推荐方法及系统
- 下一篇:一种检索软件功能的装置