[发明专利]一种基于ARIMA-SVM组合模型的空气质量预测算法在审
申请号: | 201911089421.5 | 申请日: | 2019-11-08 |
公开(公告)号: | CN111143768A | 公开(公告)日: | 2020-05-12 |
发明(设计)人: | 彭艺;杨涛锋 | 申请(专利权)人: | 昆明理工大学 |
主分类号: | G06F17/18 | 分类号: | G06F17/18;G06K9/62 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 650093 云*** | 国省代码: | 云南;53 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 arima svm 组合 模型 空气质量 预测 算法 | ||
本发明涉及一种基于ARIMA‑SVM组合模型的空气质量预测算法,属于数据挖掘领域。该算法首先对空气质量数据进行平稳性检验,若非平稳通过差分处理使数据平稳,接着根据数据yt特点进行ARIMA建模分析,得到预测结果接着对预测结果的残差Nt使用SVM模型进行预测分析得到结果把两个模型的预测结果相加即得到ARIMA‑SVM组合模型的预测结果。本发明提出的组合模型能够改进现有的单一模型在对空气质量数据进行分析预测的时候不能同时挖掘数据的线性以及非线性特征信息造成预测精度的下降的问题,大幅度提高预测精度。
技术领域
本发明涉及一种数据挖掘领域,具体的涉及一种基于ARIMA-SVM组合模型的空气质量预测算法。
背景技术
近年来,随着工业生产的发展与人类活动的增加,造成大量能源消耗与废物排放,空气质量问题日益突出,尤其是可吸入颗粒物(PM2.5)严重影响人体健康。因此空气质量的精准预测对人们的生产、生活、培养保护环境意识等具有重要的指导意义。
PM2.5浓度受多个因素影响同时兼具线性和非线性的特点,目前对PM2.5的预测主要有神经网络、灰色预测、时空数据模型、支持向量机等方法。以上的这些现有的单一模型在对空气质量数据进行分析预测的时候不能同时挖掘数据的线性以及非线性特征信息造成预测精度的下降。
发明内容
为了弥补先有技术的不足,本发明提供了一种能同时挖掘数据线性以及非线性信息从而提高预测精度的一种基于基于ARIMA-SVM组合模型的空气质量预测算法。
为实现上述目的,设计了三个部分:ARIMA模型预测、SVM模型预测、确定组合模型的预测结果。
其各个部分的方法如下:
所述ARIMA(p,d,q)模型预测,ARIMA模型只能对严平稳数据进行预测分析,对数据进行平稳性检验,若是严平稳则不对数据进行处理,若是非严平稳怎对数据进行d阶差分处理使数据变为严平稳。
对ARIMA(p,d,q)模型进行定阶主要是确定(p,d,q)的值,其中d的值在第一步中已经确认。在ARIMA的数学模型中,一般把时间序列在某时刻的值视为过去若干时间值与一组白噪声的线性叠加。即:
式(1)中yt是待分析的平稳时间序列,εt为白噪声序列。通过对序列自相关系数图以及偏自相关系数图的观察可以确定自回归阶数p和移动平均阶数q,模型完成定阶后,可确定系数γi、γi。
ARIMA模型定阶完成后,对浓度数据yt进行ARIMA建模得到预测结果
所述的SVM模型预测主要的工作是:支持向量机(SVM)最初被提出来用来解决分类问题,后来随着理论的发展通过非线性映射把数据映射到高维空间完成线性回归以此来解决原来样本空间的非线性回归问题。设训练集xi∈RD,yi∈R,则设SVM的回归方程为:
式中w是权向量,b是拟合偏差,“·”表示内积,f(x)是x的非线性函数,同时f(x)又是的线性函数,这样就把问题由原本空间的非线性回归转化为了高维空间的线性回归。为了减少计算量,引入核函数取代高维空间中的内积运算将其转化为原样本空间运算,得到SVM的非线性拟合函数:
式中为权值,根据Mercer定理K(xi,xj)为满足的核函数。
把对浓度数据yt进行ARIMA建模得到预测结果与实际空气浓度数据yt进行作差处理得到残差
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于昆明理工大学,未经昆明理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911089421.5/2.html,转载请声明来源钻瓜专利网。