[发明专利]一种基于EEMD的时间序列数据异常值检测和校正方法有效
申请号: | 201710382648.3 | 申请日: | 2017-05-26 |
公开(公告)号: | CN107273234B | 公开(公告)日: | 2020-02-14 |
发明(设计)人: | 方海泉;薛惠锋;王海宁;罗婷;郭姣姣 | 申请(专利权)人: | 中国航天系统科学与工程研究院 |
主分类号: | G06F11/07 | 分类号: | G06F11/07 |
代理公司: | 11009 中国航天科技专利中心 | 代理人: | 马全亮 |
地址: | 100048*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 eemd 时间 序列 数据 异常 检测 校正 方法 | ||
一种基于EEMD的时间序列数据异常值检测和校正方法,主要考虑现有方法不能很好地根据时间序列变化特性检测局部异常值。本发明方法包括:获取原始时间序列数据,按照时间顺序排序,对缺失数据用0值填补;对原始数据用中位数法进行异常值初步检测,把检测出的异常值用0值替换;对初步检测后的数据用EEMD法进行异常值精细检测,把检测出的异常值用0值替换;经过两次异常值检测,异常值都用0值替换了,接下来用局部曲线拟合方法对0值进行填补,也即对异常值校正。经过异常值检测和校正得到更接近客观真实的数据。该方法可用于一维时间序列数据的异常值检测和校正,适用的领域广泛,如:水资源监测数据、交通流数据、气象监测数据、金融数据等。
技术领域
本发明涉及一种基于EEMD的时间序列数据异常值检测和校正方法,数据处理领域。
背景技术
对于时间序列异常值检测方法的研究,前人已经提出了很多算法,如基于统计、聚类、距离、密度等异常值检测方法。但是这些方法没有考虑时间序列数据的时序变化特性,而是从数据全集考虑,隐藏在局部的异常值难以检测。
经验模态分解(Empirical Mode Decomposition,EMD)方法是由Norden E.Huang等人于1998年提出。EMD在机械故障诊断、地球物理探测、生物医学分析等方面都得到广泛的应用。尚未见有文献用于时间序列异常值检测。EMD可将不同尺度的波动或趋势从原信号中逐级分离出来。EMD适用于分析非线性非平稳信号,且具有完全自适应性。原始的时间序列x(t)经过EMD分解得到一系列固有模态函数(Intrinsic Mode Function, IMF)和一个残余项(residual,简记res),即
其中ci表示第i个IMF,rn为残余项。EEMD是EMD的改进算法,有效解决了EMD的混频现象。
曲线拟合的原理是已知样本点(xi,yi)(i=1,2,3,…,n),求出解析函数y≈f(x),使f(x) 在原样本点xi上尽可能接近yi的值。曲线拟合方法包括最小二乘曲线拟合(多项式拟合) 和线性插值拟合,最小二乘曲线拟合,就是使误差平方和最小的多项式拟合。即寻找一条曲线使在误差平方和最小的准则下与所有数据点最为接近,也即找出使最小的f(x)。通常,多项式的次数选用3次,低于3次,可能会造成波峰丢失,高于3 次,拟合时间长,容易产生虚假波峰。
发明内容
本发明的技术解决问题是:克服现有技术的不足,提供了一种基于EEMD的时间序列数据异常值检测和校正方法,用于解决监测数据存在不可靠数据的问题。
本发明的技术解决方案是:
一种基于EEMD的时间序列数据异常值检测和校正方法,步骤如下:
(1)对原始时间序列数据,按照时间顺序进行排序,对缺失数据用0值填补,得到初步整理数据;
(2)对所述初步整理数据进行异常值检测处理,把检测出的异常值用0值替换;
(3)对异常值检测处理之后的数据进行异常值校正处理,即对数据中的0值进行填补,完成时间序列数据异常值检测和校正。
步骤(2)对初步整理数据进行异常值检测处理,包括如下步骤:
(2.1)通过中位数法对所述初步整理数据进行初步检测;
(2.2)通过EEMD法对所述初步检测之后的数据进行精细检测。
所述步骤(3)对异常值检测处理之后的数据进行异常值校正处理,采用曲线拟合法实现。
所述通过中位数法对所述初步整理数据进行初步检测,具体为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国航天系统科学与工程研究院,未经中国航天系统科学与工程研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710382648.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种数据读取方法和装置
- 下一篇:一种基于移动终端的故障录波数据处理方法