[发明专利]一种中长期径流集合预报方法有效
申请号: | 201910839694.0 | 申请日: | 2019-09-06 |
公开(公告)号: | CN110555561B | 公开(公告)日: | 2022-04-01 |
发明(设计)人: | 张腾;王忠静;张子雄 | 申请(专利权)人: | 清华大学 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06N20/00 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 廖元秋 |
地址: | 100084*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 中长期 径流 集合 预报 方法 | ||
1.一种中长期径流集合预报方法,其特征在于,包括以下步骤:
1)确定预报对象,获取预报对象过去N年逐月的历史径流数据,N≥30;获取距离预报对象最近的M个气象站点的过去N年逐月的历史气象数据作为预报对象的本地相关因子,M≥2,所述气象数据包括月平均降雨量数据和月气温数据,其中,月平均降雨量数据包括每日8时至次日8时的24小时降雨量的月平均值和每日20时至次日20时的24小时降雨量的月平均值,月气温数据包括月平均最高气温、月平均气温和月平均最低气温;
2)获取气候因子数据,作为预报对象的遥相关因子;具体步骤如下:
2-1)获取p个气候因子过去N年逐月的历史数据,p6;
2-2)对步骤2-1)获取的每个气候因子过去N年逐月的历史数据与预报对象过去N年逐月的历史径流数据进行相关性分析,得到每个气候因子与预报对象历史径流数据的相关性系数;
2-3)对步骤2-2)得到的结果按照绝对值大小进行排序,从排序结果中筛选相关性系数绝对值大于0.4的前f个气候因子,p≥f≥6,将所述f个气候因子过去N年逐月的历史数据作为预报对象的遥相关因子;
3)确定待预报月份,确定待预报月份的预报因子集;具体步骤如下:
3-1)确定待预报月份;
3-2)根据步骤3-1)确定的待预报月份,利用步骤1)获取的本地相关因子和步骤2)获取的遥相关因子,设置时间滞后因子lag,依次令lag=1,2,…,12,表示每个历史年份待预报月份历史径流数据滞后于各个本地相关因子和遥相关因子数据的月份数,将待预报月份过去N年每年历史径流数据与该年份待预报月份lag月前每个本地相关因子数据进行Pearson相关性分析,得到待预报月份历史径流数据与对应lag月前的本地相关因子的相关性系数;将待预报月份过去N年每年历史径流数据与该年份待预报月份lag月前每个遥相关因子数据进行Pearson相关性分析,得到待预报月份历史径流数据与对应lag月前的遥相关因子的相关性系数;
3-3)将预报对象过去N年逐月的历史径流数据中每个年份中待预报月份前11个月份的历史径流数据作为该年份待预报月份历史径流数据的时间序列自相关因子,将过去N年每年待预报月份历史径流数据分别与该月份前11个月份的历史径流数据进行自相关分析,得到待预报月份历史径流数据分别与该月份前11个月份历史径流数据的相关性系数;
3-4)利用步骤3-2)、步骤3-3)的相关性分析结果,将各遥相关因子、本地相关因子和时间序列自相关因子按照对应的相关性系数的绝对值从高到低顺序进行排序,选取相关性系数绝对值大于0.4的前A个因子作为待预报月份径流数据的预报因子并组成待预报月份径流数据的预报因子集,当A≥8时,令A=8;其中,每个预报因子记为Fk,j(m),对应的相关性系数记为Rk,j,Fk,j表示第k个月的第j个预报因子;Rk,j表示第k个月份历史径流数据与第k个月的第j个预报因子Fk,j的相关性系数;m表示因子对应的月份,m=1,2,…,12;下标k表示待预报月份,k=1,2,…,12;下标j表示待预报月份径流数据的第j个预报因子,j=1,2,…,8;
4)根据步骤3-1)确定的待预报月份,建立该待预报月份对应的机器学习径流预报模型并进行模型验证,得到验证完毕的机器学习径流预报模型;
4-1)将步骤3-1)确定的待预报月份的过去N年每年的历史径流数据及该年份的待预报月份历史径流数据对应的预报因子集数据组成一个样本,将所有样本组成样本集,从样本集中随机选取2/3的样本作为模型的训练集,剩余1/3的样本作为模型的验证集;
4-2)构建一个机器学习径流预报模型作为当前模型,将训练集的每个样本中预报因子集数据Fk,ji(m)作为模型的输入,其中Fk,ji(m)表示训练集中第i个样本的第k个月第j个预报因子的值;模型输出对应的该年份待预报月份的历史径流数据的预测值;
4-3)将训练集中每个样本对应的待预报月份的历史径流数据与该样本对应的模型输出的预测值进行对比,通过训练相关系数R1和训练相对偏差rBias1评价当前模型:
式中,Oi表示训练集中第i个样本的历史径流数据,Oave表示训练集中所有样本历史径流数据的平均值;O′i表示训练集中第i个样本对应的模型输出的预测值,O'ave表示训练集中所有样本对应的模型输出的预测值的平均值;n表示训练集样本总数,n=(2/3)N;
4-4)对当前模型参数进行调整和优化,重复步骤4-2)至4-3),选择满足训练相对偏差rBias1<20%且训练相关系数R12最大的模型作为训练完毕的机器学习径流预报模型;
4-5)将验证集中每个样本的预报因子集数据输入到步骤4-4)训练完毕的机器学习径流预报模型中,计算得到验证集中每个样本对应的待预报月份历史径流数据的预测值;将验证集每个样本对应的待预报月份历史径流数据预测值与该样本对应的待预报月份历史径流数据进行对比,通过验证相关系数R2和验证相对偏差rBias2进行当前模型评价:
式中,Ot表示验证集中第t个样本的历史径流数据,Oave2表示验证集中所有样本历史径流数据的平均值;O′t表示验证集中第t个样本对应的模型输出的预测值,O'ave2 表示验证集中所有样本对应的模型输出的预测值的平均值;l表示验证集样本总数,l=(1/3)N;
若∣R2∣>0.6且rBias2<20%,则当前模型达到验证精度要求,模型验证完毕,将当前模型作为最终的机器学习径流预报模型,进入步骤5);否则,当前模型不满足精度要求,则重新返回步骤4-5),直至当前模型达到验证精度要求,模型验证完毕,将当前模型作为验证完毕的机器学习径流预报模型,进入步骤5);
5)获取待预报月份对应的预报因子集数据并输入到步骤4)得到的最终机器学习径流预报模型,模型输出即为预报对象待预报月份径流量的预报值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910839694.0/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理