[发明专利]基于集成学习的强对流天气持续时间预报方法在审
申请号: | 201911003227.0 | 申请日: | 2019-10-22 |
公开(公告)号: | CN110794485A | 公开(公告)日: | 2020-02-14 |
发明(设计)人: | 文立玉;罗飞;向元吉 | 申请(专利权)人: | 成都信息工程大学 |
主分类号: | G01W1/10 | 分类号: | G01W1/10;G06N20/20 |
代理公司: | 11308 北京元本知识产权代理事务所 | 代理人: | 王红霞 |
地址: | 610225 四川省成都*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 强对流天气 学习算法 预报参数 预报 机器学习算法 神经网络算法 多项式回归 归一化处理 决策树算法 数据预处理 最近邻算法 集成学习 时间预报 训练测试 多机器 气象站 强对流 数据源 探空 算法 剔除 输出 气象 天气 | ||
1.基于集成学习的强对流天气持续时间预报方法,其特征在于,包括以下步骤:
S1,数据源选取:选择预报地区的地面气象站资料以及离预报地区最近的两个探空站资料;
S2,数据预处理:剔除错误及缺测资料,根据计算出的相关强对流预报参数作为输入,选择每次强队流天气持续的时间作为输出,当天没有出现强对流天气则认为时间为0,对预报参数即输入作归一化处理;
S3,机器学习算法选择:选用K最近邻算法、多项式回归算法、决策树算法、神经网络算法;
S4,集成学习执行流程:将归一化后的气象特征数据作为输入,采用交叉验证的方式来训练数据,将数据分为10份,对于每一个算法,将前9份用来训练和验证,最后一份用来测试和对模型评分,将前9份数据用来训练的过程中,每次取8份用来训练模型,取1份用来验证模型准确率,根据此规则,每个算法开始都将得到9个模型和9个模型评分,选评分最高的,用来测试最后一份数据,并把测试得分作为此算法的最终得分;根据上述的模型训练方法和评分标准,对于每一个算法会训练出9个模型,根据每个模型得分,选出一个最优模型;四个算法各有一个最优模型,根据最开始划分的最后一份测试数据,对四个算法的最优模型进行测试,根据测试得分,选最优两个的两个算法作为最终算法,并结合这两个算法,将它们预测结果求和再平均,得到集成学习的预报结果。
2.根据权利要求1所述的基于集成学习的强对流天气持续时间预报方法,其特征在于,所述相关强对流预报参数包括整层比湿积分、A指数、K指数、修正K指数、总指数、修正总指数、对流有效位能、对流凝结温度、自由抬升对流温度、0—3km垂直风矢量差、强天气威胁指数、700hPa比湿、700hPa相对湿度、850hPa比湿、850hPa相对湿度、地面露点温度。
3.根据权利要求1所述的基于集成学习的强对流天气持续时间预报方法,其特征在于,所述归一化处理采用均值方差归一化,将所有用作输入的数据归一到均值为0方差为1的分布中。
4.根据权利要求1所述的基于集成学习的强对流天气持续时间预报方法,其特征在于,所述K最近邻算法在气象要素的变动是在一个稳定的范围内,即呈现出连续形态的情况下使用。
5.根据权利要求1所述的基于集成学习的强对流天气持续时间预报方法,其特征在于,所述多项式回归算法在气象预报涉及要素多,所有的要素和结果很难呈线性关系的情况下使用。
6.根据权利要求1所述的基于集成学习的强对流天气持续时间预报方法,其特征在于,所述决策树算法在强对流天气过程的产生中,每一种气象要素都起着或多或少的作用的情况下使用。
7.根据权利要求1所述的基于集成学习的强对流天气持续时间预报方法,其特征在于,所述神经网络算法在对于强对流天气持续时间和当天的气象要素的复杂关系的情况下使用。
8.根据权利要求1所述的基于集成学习的强对流天气持续时间预报方法,其特征在于,所述模型评分采用公式计算,S代表模型的一个样本得分,α代表一个预测样本的真值,β代表一个预测样本的预测值,β是一个大于等于0的数,若计算出来β小于0,则认为它为0;对于一份包含若干个样本的数据,采用S求和再取平均的方式来得到某个模型的得分。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都信息工程大学,未经成都信息工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911003227.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种倒置式探空仪的气象火箭箭头
- 下一篇:一种降雨量传感器