[发明专利]基于ARIMA和BP神经网络的区域数字经济数据处理方法在审
申请号: | 202310032908.X | 申请日: | 2023-01-10 |
公开(公告)号: | CN116244551A | 公开(公告)日: | 2023-06-09 |
发明(设计)人: | 黄捷 | 申请(专利权)人: | 福州大学 |
主分类号: | G06F17/10 | 分类号: | G06F17/10;G06N3/084 |
代理公司: | 福州元创专利商标代理有限公司 35100 | 代理人: | 陈鼎桂;蔡学俊 |
地址: | 350108 福建省福州市*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 arima bp 神经网络 区域 数字 经济 数据处理 方法 | ||
1.一种基于ARIMA和BP神经网络的区域数字经济数据处理方法,其特征在于,包括以下步骤:
步骤S1:获取系统数据库数据集,并筛选出正常数据和缺失数据;
步骤S2:对缺失数据使用拉格朗日插值法进行填补,并将填补后的数据与正常数据组合并与处理,得到专属数据集;
步骤S3:引入AIC、BIC和HQ三种准则对模型阶数进行判定,构建ARIMA模型;
步骤S4:通过移动窗口的方式生成滚动输入数据矩阵训练,构建BP神经网络;
步骤S5:基于ARIMA模型和BP神经网络,输入专属数据集,得到数据处理结果。
2.根据权利要求1所述的基于ARIMA和BP神经网络的区域数字经济数据处理方法,其特征在于,所述对缺失数据使用拉格朗日插值法进行填补具体为:
对于已知的k+1组数据[(x0,y0),...,(xk,yy)],其拉格朗日插值多项式为:
其中yi为因变量;
其中lj(x)表示拉格朗日插值基函数,表达式为:
3.根据权利要求1所述的基于ARIMA和BP神经网络的区域数字经济数据处理方法,其特征在于,所述步骤S3具体为:
步骤S31:通过二阶差分序列的ACF和PACF,确定ARIMA模型中的自回归阶数p和移动平均阶数q;
步骤S32:采用AIC、BIC和HQ准则,进一步选取最客观、合适的p,q参数值;
步骤S33:通过分析残差序列Q-Q图和Ljung-Box图,来判断所选定的ARIMA模型是否提取到序列中几乎所有的样本相关信息,确定所选定的ARIMA模型是否可用。
4.根据权利要求3所述的基于ARIMA和BP神经网络的区域数字经济数据处理方法,其特征在于,所述步骤S31具体为:
自相关函数ACF公式如下所示:
若序列平稳,有则:
其中σx表示方差,γk和γo表示协方差;
其中k表示随机变量之间的距离;
区域数字经济二阶差分序列的偏自相关函数PACF公式如下所示:
其中EXt=E[Xt|Xt-1,...,Xt-k+1],EXt-k=E[Xt-k|Xt-1,...,Xt-k+1]表示条件期望。
5.根据权利要求3所述的基于ARIMA和BP神经网络的区域数字经济数据处理方法,其特征在于,所述AIC、BIC和HQ准则,具体为:
①AIC准则:
AIC=-2ln(L)+2K (8)
其中k表示模型参数量,L表示最大似然函数;
②BIC准则:
BIC=-2ln(L)+ln(n)*K (9)
其中n表示样本数量;
③HQ准则:
HQ=-2ln(L)+ln(ln(n))*K (10)。
6.根据权利要求1所述的基于ARIMA和BP神经网络的区域数字经济数据处理方法,其特征在于,所述步骤S4具体为:采用移动窗口的方式式生成滚动输入数据矩阵,依次选取时间序列的n个值作为一组输入数据,之后的m个值作为输出数据,则N个数据会滑动生成N-(n+m)+1组样本,通过训练,建立前n个值与之后m个值之间的映射关;
对于隐含层数量及节点数,考虑到训练样本量及模型过拟合的问题,将隐含层数量设为1,节点数根据的原则定为[3,12]内;隐含层激活函数选取Sigmoid函数,输出层激活函数选取Purelin线性函数,学习率0.05,目标误差0.001,训练方法为梯度下降法,性能函数为残差平方和(RSS);
基于以上设置,构建BP神经网络。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于福州大学,未经福州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310032908.X/1.html,转载请声明来源钻瓜专利网。