[发明专利]基于互信息-核主成分分析-Elman网络的中长期径流预报方法有效
申请号: | 201710662894.4 | 申请日: | 2017-08-04 |
公开(公告)号: | CN107463993B | 公开(公告)日: | 2020-11-24 |
发明(设计)人: | 不公告发明人 | 申请(专利权)人: | 贺志尧 |
主分类号: | G06N3/08 | 分类号: | G06N3/08;G06Q10/04 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 211100 江苏省*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 互信 成分 分析 elman 网络 中长期 径流 预报 方法 | ||
1.一种基于互信息-核主成分分析-Elman网络的中长期径流预报方法,包括互信息、核主成分分析和Elman神经网络,其特征在于包含以下步骤:
S1,构建预报因子矩阵,预报因子采用74项环流特征指数或新130项大气监测指数,其中,新130项大气监测指数包括88项逐月的大气环流指数,26项逐月的海温指数,16项逐月的其他指数;预报因子按照月尺度划分,考虑滞后时间t为1-12个月,建立一个74×12或者130×12的预报因子矩阵;
S2,采用互信息的方法计算预报因子矩阵和径流时间序列的互信息,具体包括如下步骤:
S201,计算预报因子矩阵和径流时间序列的互信息,具体采用如下公式计算:
式中,X为径流时间序列,X=(x1,x2,x3...xn)T,Y为指标的时间序列,Y=(y1,y2,y3...yn)T,分子p(xi,yj)为X与Y的联合分布律,p(xi)、p(yj)分别为X与Y的边缘分布律;
S202,计算互信息后,把互信息值映射到0到1之间,具体采用如下公式计算:
式中,H(X)和H(Y)分别为X与Y的熵,H(X)与H(Y)计算公式相似;
S203,采用自举法对计算的标准互信息进行检验,随机同时打乱两个对应的时间序列顺序K次,计算每次乱序后的NMI值并按由大到小顺序排列,取顺序排列的NMI的概率分位数作为对应该概率显著性水平的NMI阈值,若原时间序列NMI值大于某概率阈值对应的NMI值,则认为这两组数据显著相关,选出通过显著性检验且标准互信息大于某一阈值的指标作为初选的预报因子;
S3,对初选的预报因子,使用核主成分分析进行降维,提取主成分,具体包含以下步骤:
S301,对初选的预报因子数据z-score标准化,具体采用如下公式计算:
式中,y*为z-score标准化后的数据,y为初选的预报因子数据中的一项,μ为y所对应的时间序列的均值,σ为y所对应的时间序列的标准差;
S302,计算初选的预报因子的核矩阵K,K为n×n的矩阵,第i行第j列的元素Ki,j的计算公式如下:
式中,是列向量,代表不同的初选的预报因子z-score标准化后的时间序列,k为核函数,可选的核函数有线性核函数多项式核函数径向基核函数Sigmoid核函数核函数公式中的b、c、p、δ、υ、ξ均为常数,是各种核函数的参数;
S303,计算中心化的核矩阵Kc,Kc为n×n的矩阵,Kc计算公式如下:
Kc=K-J·K-K·J+J·K·J
式中,J为n×n的矩阵;
S304,计算中心化后的核矩阵Kc的特征值与特征向量,并把特征值按照由大到小的顺序排列,特征向量的顺序按照特征值做对应的调整,排序后得到的特征值矩阵为特征向量矩阵为
S305,计算归一化的特征向量矩阵其中
S306,提取主成分,主成分矩阵为n×n的方阵,提取前2到3个主成分作为预报因子,第i个主成分的计算公式如下:
式中,KPCi=(kpci1,kpci2,...,kpcin),KC为步骤S303计算得到的中心化的核矩阵,i=1,2...n;
S4,构建Elman网络模型,确定网络的结构参数和训练算法,其中,结构参数包括输入层节点数和隐含层节点数,具体包含以下步骤:
S401,把到的主成分按照方差贡献率由大到小的顺序排列,采用试错法,把不同主成分和隐含层节点数进行组合,根据检验期的预报误差,确定最优的主成分和隐含层节点的个数;
S402,采用反向传播算法与带动量项且学习率自适应的梯度下降算法更行网络的权值,具体公式如下:
η(k)=η(k-1)(1+c·cosθ)
式中,E为代价函数,采用均方误差函数,ω为Elman神经网络的权值矩阵,Δωk为第k次更新时权值的改变量,η为学习速率,α为动量常数,0≤α<1,取0.9,c为常数,取0.2,θ为最速度下降方向与上一次权值改变量Δωk-1间的夹角;
S5,对确定好结构参数和训练算法的模型,利用选出的主成分对模型训练多次,进行集合预报,具体包含以下步骤:
S501,对选好的主成分因子序列和待预测地区的历史径流序列归一化,然后分成训练样本和检验样本,归一化公式如下:
式中,z为归一化后的数据,zmax=1,zmin=-1,z∈[-1,1],q为原始的径流序列或主成分序列中的一项,qmin为q所在的序列中的最小值,qmax为q所在的序列中的最大值;
S502,将训练样本中的因子数据作为网络的输入,训练样本中的历史径流数据作为网络的输出,对网络进行有监督的学习训练;
S503,对经过训练后的网络,用检验样本中的因子作为网络的输入,对网络的输出结果反归一化,得到预测的径流值,然后对预测值进行评价,并根据《水文情报预报规范》(GI3/T22482-2008)中评定中长期径流预报精度的方案,以预报的最大相对误差小于20%的预报为合格预报;
S504,重复步骤S502和步骤S503,训练出多个模型,对多个模型的预测值进行平均,作为集合预报的值。
2.根据权利要求1中所述的基于互信息-核主成分分析-Elman网络的中长期径流预报方法,其特征在于,S503中,对预测值进行评价,评价的指标包括平均绝对百分误差MAPE、相对误差RE、最大相对误差MRE和合格率QR,各指标的计算公式如下:
式中,为检验期预测的径流值,xi为对应的实际径流值,j为检验的样本个数,TQual为合格的预报次数,Ttotal为总的预报次。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于贺志尧,未经贺志尧许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710662894.4/1.html,转载请声明来源钻瓜专利网。