[发明专利]一种基于ARIMA-SVR的水文时间序列异常值检测方法有效
申请号: | 201711210505.0 | 申请日: | 2017-11-28 |
公开(公告)号: | CN107908891B | 公开(公告)日: | 2019-10-18 |
发明(设计)人: | 娄渊胜;孙建树;叶枫;盖振 | 申请(专利权)人: | 河海大学 |
主分类号: | G06F17/50 | 分类号: | G06F17/50 |
代理公司: | 南京苏高专利商标事务所(普通合伙) 32204 | 代理人: | 李玉平 |
地址: | 210098 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 arima svr 水文 时间 序列 异常 检测 方法 | ||
本发明公开了一种基于ARIMA‑SVR的水文时间序列异常值检测方法,包括以下步骤:首先获取水文时间序列数据,对水文时间序列进行ARIMA拟合,ARIMA模型可以很好的拟合数据的线性部分,但当数据中存在非线性部分时,拟合效果较差;然后得到ARIMA部分的残差,用10折交叉验证的方法寻找出SVR最佳的gamma、cost和核函数的组合;最后将两部分拟合值相加得到最终的预测值,并求出置信度为p的置信区间,将预测值与置信区间比较,在置信区间之外的就判定为异常值。本发明为水利相关从业者提供了一种寻找水文时间序列中异常值的方法,水文时间序列中的异常值检测对于防汛抗旱等工作具有重要的指导意义。
技术领域
本发明涉及一种基于统计学习和机器学习领域的水文时间序列异常值检测的模型构建方法,具体地说,是综合了经典的支持向量回归、统计学中的ARIMA模型等技术对时间序列中的值进行检测。
背景技术
异常值检测是水文数据挖掘中的重要组成部分,水位的变化受到季节和其他突变因素的影响,同时还包含着噪声因素,单一模型的检测能力有限,传统的ARIMA模型预测非线性时间序列精度不够高,支持向量回归结构复杂,易产生“过拟合”的问题。对这些方法的单独优化并不能克服单种方法的局限性。因此,结合多种模型形成的异常值检测方法已经成为时间序列异常值检测的方向。
发明内容
发明目的:针对现有的时间序列异常值方法不具有针对性、灵敏度和特异度相对较低的缺点,根据水文时间序列的波动特点,采用ARIMA模型和SVR相结合的方法对水文时间序列进行异常检测,提高水文时间序列异常检测的灵敏度和特异度。
技术方案:一种基于ARIMA-SVR的水文时间序列异常值检测方法,利用第三方软件R语言作为程序编制和模型仿真检查的工具,构建三个模块,分别是ARIMA建模模块、SVR残差建模模块、组合预测值得到置信度为p的置信区间模块。首先对水文时间序列进行平稳性检验,对通过平稳性检验的采用ARIMA模型对其进行处理;因为经过ARIMA函数拟合的残差序列总体平稳且线性不可分,因此采用SVR对残差进行拟合预测。最终将ARIMA对序列总体趋势的预测和SVR对残差的预测相加并得到置信度为p的置信区间,实现根据置信区间判断异常值的方法。
主要实现步骤如下:
步骤1:取待检测值的前n个值,形成水文时间序列,对水文时间序列进行平稳性检验,如果通过,进入下一步;如果不通过,对序列持续差分直到差分后的序列满足平稳性检验;
步骤2:通过步骤1得到水文时间序列的差分阶数d;以AIC信息准则为准,限定自回归的阶数p和移动平均阶数q的范围,遍历(p,q)组合,找出具有最小AIC值的(p,q)组合;
步骤3:将上述步骤中确定的最优p,d,q应用于ARIMA模型预测t时刻的值,同时得到置信度为α的置信区间;
步骤4:将步骤3中的得到的预测值与实际值相减得到残差,作为训练集输入到SVR;
步骤5:针对非线性回归问题,先使用非线性函数把训练集中的样本数据映射到一个高维特征空间,并在这个高维特征空间进行线性回归。训练样本(xi,yi)满足如下条件:yi(xi*ω+b)-1+ξi≥0其中ξi称为松弛变量,ω为法向量决定了超平面的方向,b为位移项,且满足ξi≥0,i=1,2,3…n。
步骤6:采用10折交叉验证的方法,寻找出最佳的gamma、cost和核函数的组合以达到最佳的残差拟合。因为经过ARIMA函数拟合的残差序列总体平稳且线性不可分,因此本文选用径向基函数为核函数。
步骤7:利用步骤6中得到的最佳参数构建SVR模型,然后预测出残差。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河海大学,未经河海大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711210505.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种软岩边坡稳定性有限元分析及监测、支护方法
- 下一篇:螺旋成形