[发明专利]基于GBDT+LR模型的冰雹和短时强降水预报方法在审
申请号: | 201911204076.5 | 申请日: | 2019-11-29 |
公开(公告)号: | CN110888186A | 公开(公告)日: | 2020-03-17 |
发明(设计)人: | 路志英;汪永清 | 申请(专利权)人: | 天津大学 |
主分类号: | G01W1/10 | 分类号: | G01W1/10 |
代理公司: | 天津创智天诚知识产权代理事务所(普通合伙) 12214 | 代理人: | 陈昌娟 |
地址: | 300072*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 gbdt lr 模型 冰雹 短时强 降水 预报 方法 | ||
1.一种基于GBDT+LR模型的冰雹和短时强降水预报方法,包括以下步骤:
S1,原始数据获取:获取某一地区往年每年3月至9月冰雹和短时强降水发生前三小时的地面气象观测站点数据,获取该地区上游的多个探空站点数据;
S2,通过SMOTE过采样算法对上述数据中数据量相对较小的冰雹过程数据进行扩充,得到过采样后的数据集;
S3,采用PCA方法对所述过采样后的数据集进行降维;
S4,数据集的划分:将降维后的数据集中的样本划分为训练集和测试集;
S5,构建GBDT+LR模型,将GBDT模型的叶节点所提取的特征作为LR模型的输入特征,通过所述训练集和测试集的样本对GBDT+LR模型进行训练和测试;
S6,采集所述地区待预测时间点之前三小时的地面气象观测站点数据,获取该地区上游的多个探空站点数据;
S7,将S6中的数据经PCA降维后代入训练好的GBDT+LR模型,判定所述预测时间点出现的是冰雹还是短时强降水。
2.根据权利要求1所述的冰雹和短时强降水预报方法,其特征在于:所述GBDT+LR模型的构建过程如下:
(1)构建GBDT模型,如下式:
式中:β为每一个基础学习器的相应权重;α为每一个基础学习器的参数;参数为M个数据(xi,yi)的损失函数最小最优解P,
设损失函数L:
其中,l为每次迭代的基础学习器的损失函数,
则:
对于每一个样本xi,都可以得到一个梯度下降方向,即:
优化公式(8)得到:
进而求得βn:
最终获得GBDT算法模型的迭代描述:
Fn(x)=Fn-1(x)+βnh(x;αn) (13)
(2)在所述GBDT模型后面串接基于sigmoid函数的LR二分类模型,Sigmoid函数如下式所示:
其中,θ为模型的权重系数,x为GBDT模型所提取的叶节点的参数。
3.根据权利要求2所述的冰雹和短时强降水预报方法,其特征在于:所述GBDT+LR模型的最大迭代次数为10,学习率为0.02,树的最大深度设置为4。
4.根据权利要求3所述的冰雹和短时强降水预报方法,其特征在于:步骤S2中,通过SMOTE过采样算法对冰雹过程数据进行扩充的步骤如下:
1)对于冰雹过程数据的每一个样本xi,计算它到冰雹过程数据中其他样本的欧氏距离;
2)根据样本的比例设置采样倍率,选取多个相近的冰雹过程数据中的样本,设其选择的近邻点为
3)对于每一个随机选择的近邻点依据式(1)构建新的样本点:
对冰雹过程数据进行扩充。
5.根据权利要求4所述的冰雹和短时强降水预报方法,其特征在于:步骤S1中,所述地面气象观测站点数据包括地平面气压、海平面气压、温度、露点温度、相对湿度、水汽压、2分钟平均风向、2分钟平均风速、10分钟平均风向和10分钟平均风速。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911204076.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种改善的二极管玻璃钝化的方法
- 下一篇:一种无隔片圆管及其应用