[发明专利]一种基于非平稳时间序列分解的统计降尺度方法有效

专利信息
申请号: 202010376317.0 申请日: 2020-05-07
公开(公告)号: CN111597494B 公开(公告)日: 2022-06-17
发明(设计)人: 李欣桐;张晓东;王曙光 申请(专利权)人: 山东大学
主分类号: G06F17/10 分类号: G06F17/10
代理公司: 济南金迪知识产权代理有限公司 37219 代理人: 赵龙群
地址: 250199 山*** 国省代码: 山东;37
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 平稳 时间 序列 分解 统计 尺度 方法
【权利要求书】:

1.一种基于非平稳时间序列分解的统计降尺度方法,其特征在于,具体步骤包括:

S1.降尺度数据准备:

收集全球气候模型GCM的大尺度数据和地面观测的小尺度数据,形成数据集;所述大尺度数据包括降水时间序列、最大温度时间序列、最小温度时间序列;小尺度数据也包括降水时间序列、最大温度时间序列、最小温度时间序列;

大尺度数据作为待降尺度数据;同一变量对应的小尺度数据作为真实值用于大尺度数据的降尺度模型的训练;所述变量包括降水、最大温度、最小温度;

并将数据集划分为训练数据集和测试数据集;

S2.非平稳时间序列分解:

使用BEMD算法对步骤S1中同一变量对应的大尺度数据和小尺度数据进行非平稳时间序列分解,分别得到IMF分量组和一项残差分量,即一组分解结果;大尺度数据分解得到分量的时间尺度和小尺度数据分解得到的分量的时间尺度具有同步性;

通过调整BEMD算法中的投影方向的数量Ndir和迭代停止条件,获得多组分解结果;

步骤S2中,非平稳时间序列分解采用的BEMD算法的具体步骤为:

(1)将某一变量对应的GCM的大尺度数据和地面观测的小尺度数据组成一个二维数据x(t),t表示时间,所述变量包括最大温度、最小温度和降水;

(2)根据公式确定二维数据x(t)的投影方向其中1≤n≤Ndir;Ndir表示投影方向的数量,n表示第n个投影方向;

(3)对二维数据x(t)进行投影,得到未分解的原始气候序列x(t)在方向上的投影二维数据采用处理复数投影的方式计算投影,即二维数据x(t)的两个维度标记为a(t),b(t),a(t)和b(t)代表大尺度和小尺度的气候序列;对以x(t)=a(t)+b(t)j复数形式的数组进行复数向量的投影,即采用进行数据投影,其中,j表示虚数单位,Re(·)代表数据的实数部分,中依据欧拉公式e=cosθ+i·sinθ计算;

(4)提取投影的局部极值记录极值位置为

(5)使用三次样条插值算法插值步骤(4)中极值,获取包络线,提取的极值数据集获取投影方向上的极值包络线

(6)重复步骤(3)-(5)获取所有投影方向上的包络线;

(7)计算所有投影方向上包络线的均值m(t),

(8)二维数据x(t)减去m(t)获得h(t),判断h(t)是否满足以下条件之一:

8-a、h(t)满足IMF的物理意义,满足IMF的物理意义包括IMF分量极值的个数和过零点的个数之差的绝对值小于1;IMF分量极大值插值的包络线与极小值插值的包络线的均值为0;

8-b、满足迭代停止条件;

8-c、达到最大迭代次数;

如果满足上述条件,则进行步骤(9);

如果不满足上述条件,则令x(t)=h(t),重复步骤(2)-(7),进行迭代运算,直到h(t)满足条件;

(9)将步骤(8)最终得到的h(t)标记为ci(t),ci(t)即为第i个IMF分量;从x(t)中减去第i个IMF分量,得到第i个IMF分量提取后的剩余ri(t),即ri(t)=x(t)-ci(t);将得到的ri(t)作为新的x(t);

(10)重复(3)-(9),直至满足下列条件之一:

10-a、无法再提取IMF分量,即最终得到的残差分量ri+1(t)除两端端点外无极大值和极小值,无法再插值极值成包络线执行(4)之后的步骤进行IMF分量的提取;

10-b、满足迭代停止条件;

10-c、达到最大的迭代次数;

最后提取到第i+1个IMF分量标记为ci+1(t),提取后的残差分量标记为ri+1(t)=ri(t)-ci+1(t);

(11)最终原始的二维数据被表示为K为IMF分量的总数,ck(t)是第k个IMF,rk+1(t)是最终的残差分量,即趋势项;

S3.最优时间序列分解结果的选择:

利用正交性指数OI从步骤S2得到的多组分解结果中选择最优时间序列分解结果,即确定最优Ndir值,具体为:

对于降水时间序列、最大温度时间序列、最小温度时间序列的任一组分解结果,分别计算GCM分解结果的正交指数OIGCM和地面观测分解结果的正交指数OIOB,将两个正交指数相加即得到一组分解结果的正交性指标OIT,即OIT=OIGCM+OIOB

从多组分解结果的正交性指标OIT中,选择正交性指标OIT最低时对应的Ndir,即为最优Ndir值;

S4.RF模型训练:

采用最优时间序列分解结果中大尺度数据和小尺度数据的每一IMF分量对和残差分量对训练降尺度模型,降尺度模型为RF模型;GCM的IMF分量和残差分量是训练的自变量,地面观测的IMF分量和残差分量是训练的因变量;

所述RF模型中树的个数为500,最大的叶子节点数为20,节点可分的最小样本数为2;采用MSE、MAE评价一次分裂的结果,最小不纯度为1e-7,叶子节点最小的样本权重和为0;

S5.训练后时间序列分解分量的合成:

训练后的各个时间尺度的IMF分量和残差分量重新进行逆合成,以获得正常的降尺度降水时间序列、最大温度时间序列、最小温度时间序列;

所述逆合成是将所有分量重新相加,即按照r+IMFi+IMFi-1+…+IMF3+IMF2+IMF1,其中,r代表残差分量,i代表第i个IMF分量;

S6.模型评估:

利用均方根误差、相关性系数、拟合优度对降尺度结果进行精度验证和模型评估;降尺度结果包括步骤S5得到的降水时间序列、最大温度时间序列、最小温度时间序列;

S7.未来情景的降尺度:

S7-1.获得未来情景的GCM的大尺度数据;

S7-2.进行EMD分解得到与已训练RF模型相对应的不同时间尺度的分量结果;

S7-3.利用步骤S4中训练好的RF模型进行对应时间尺度分量的降尺度,获得降尺度后的各时间尺度分量;

S7-4.将RF模型输出的降尺度分量按照步骤S5中的合成方法进行重新合成,从而获得未来的降尺度结果,用于未来区域的水文研究或者气候研究。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东大学,未经山东大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010376317.0/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top