[发明专利]基于随机森林算法的降雨—径流模拟方法在审
申请号: | 202010070774.7 | 申请日: | 2020-01-21 |
公开(公告)号: | CN111291478A | 公开(公告)日: | 2020-06-16 |
发明(设计)人: | 赵雪花;张丽娟;王畅;裴源博;祝雪萍;蔡文君 | 申请(专利权)人: | 太原理工大学 |
主分类号: | G06F30/20 | 分类号: | G06F30/20;G06N20/00;G06F111/10 |
代理公司: | 太原市科瑞达专利代理有限公司 14101 | 代理人: | 申艳玲 |
地址: | 030024 山西*** | 国省代码: | 山西;14 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 随机 森林 算法 降雨 径流 模拟 方法 | ||
本发明公开了一种基于随机森林算法的降雨—径流模拟方法。主要包括:利用随机森林算法对具有不同降雨特征的场次降雨进行径流模拟,结合随机森林算法提出了一种综合降雨特征的降雨—径流模型,借助机器学习算法将场次降雨的特征作为模型输入,径流量作为模型输出,从而实现径流模拟过程。避免了传统降雨—径流模型的参数率定工作,计算过程简单,可得到较好的模拟效果,同时可用于不同区域的径流模拟研究工作,为径流模拟提供了新的方法。
技术领域
本发明涉及小流域径流模拟研究领域,具体涉及一种基于随机森林算法的降雨—径流模拟方法。
背景技术
目前径流模拟方法的发展已经日趋成熟,选用水文模型进行径流模拟是水文学领域的主要研究方向。降雨是重要的水文气象要素,径流、土壤含水量及其它水文过程均受到降雨的影响。降雨—径流模型在径流模拟应用中取得了良好的效果,但小流域缺少历史降雨径流过程资料,限定了进行径流模拟研究时使用的模型及方法,而数据驱动的降雨—径流模型因其简洁高效,对数据要求低等特点得到了广泛应用,同时随着机器学习领域的兴起,将机器学习算法与径流模拟结合也逐渐成为研究热点。
发明内容
本发明旨在提供一种基于随机森林算法的降雨—径流方法,通过对降雨特征进行筛选,建立具有研究流域特征的降雨属性集合,综合降雨特征及随机森林算法提出一种降雨—径流方法,对小流域次降雨径流模拟具有重要理论指导意义。
本发明提供了一种基于随机森林算法的降雨—径流模拟方法,该方法包括:
步骤1:获取场次降雨—径流观测数据,分析整理出具有区域代表性的M维降雨特征集合D,所述M维降雨特征包含降雨量、降雨历时、平均降雨强度、30分钟降雨强度以及表征流域土壤水分情况的前期影响雨量等;
步骤2:利用灰色关联分析对所述降雨特征进行优势降雨特征提取,构建由N维优势降雨特征组成的降雨属性集合D′,D′∈D,N≤M;
步骤3:以决策树作为基学习器构建随机森林模型,进行模型训练与测试,最终实现径流模拟过程。
其中,步骤2所述利用灰色关联分析对所述降雨特征进行优势降雨特征提取,构建由N维优势降雨特征组成的降雨属性集合D′具体包括:
(1)确立径流量为母因素序列Y,降雨特征为子因素序列Xi:
Y=Y(k)|k=1,2,…n
Xi=Xi(k)|k=1,2,…n;i=1,2,…m
(2)将原始数据做均值化无量纲处理y(k)、xi(k):
(3)计算关联系数ξi(k):
(4)计算关联度ri,并由关联度构成关联度矩阵R:
式中,k表示序列长度,i表示子因素个数,△i(k)表示第k个母因素及相应子因素差值的绝对值,ρ表示分辨系数,ρ∈(0,1),可提高关联系数间的差异显著性,ρ越小,分辨力越大,一般取经验值0.5。
(5)根据关联度矩阵中各列的关联度大小判断优势降雨特征子因素。对降雨特征进行优势判断,剔除非优势特征,提取关键优势特征构建降雨属性集合D′,结合区域特征综合考虑降雨特征对产流的影响。
步骤3所述以决策树作为基学习器构建随机森林模型,进行模型训练与测试,最终实现径流模拟过程具体包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于太原理工大学,未经太原理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010070774.7/2.html,转载请声明来源钻瓜专利网。