[发明专利]基于改进决策树算法的降水预测方法有效
申请号: | 201911012069.5 | 申请日: | 2019-10-23 |
公开(公告)号: | CN110824586B | 公开(公告)日: | 2021-11-19 |
发明(设计)人: | 常敏;陈果 | 申请(专利权)人: | 上海理工大学 |
主分类号: | G01W1/10 | 分类号: | G01W1/10;G06N3/04;G06N3/08;G06N20/00 |
代理公司: | 上海申汇专利代理有限公司 31001 | 代理人: | 徐颖 |
地址: | 200093 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 改进 决策树 算法 降水 预测 方法 | ||
本发明涉及一种基于改进决策树算法的降水预测方法,收集数年各地的气象数据,以及相应的降水等级数据;对所得到的气象数据进行归一化处理,得到相应的归一化数据集,对归一化数据集按比例进行划分为训练集与测试集;将训练集带入到改进后的决策树网络中进行训练,将测试集代入到训练完毕后的决策树模型中,检验训练结果,最后将待测数据输入到训练完毕后的决策树网络进行预测,输出结果,评定其降水等级;以决策树为核心,采用自变量平均影响值来进行选择,即根据属性对结果的影响大小来进行选择,选择影响程度最大的属性进行分枝,通过改进决策树算法进行训练,使得海量数据进行了充分的利用,提高了预测的准确率,减少误判和漏判问题的发生。
技术领域
本发明涉及一种数据挖掘技术,特别涉及一种基于改进决策树算法的降水预测方法。
背景技术
随着社会经济发展以及人类本身对气象服务要求不断提升,气象领域的气象数据采集渠道日益丰富,数据规模不断增加,且其具有的空间属性、高维性、不稳定性,为研究传统气象预报模式增加巨大难度,尤其在研究各气象要素之间内部联系时,尤为乏力,从而导致获取到的大量气象资料并未有效利用,对于推动气象模式预报发展并未有实质性作用。天气系统的内部相互影响条件错综复杂,对于大量的采集数据进行分析处理时,传统的气象研究模式无法发现其隐含的价值,而数据挖掘技术为研究大量气象数据提供了新途径,为气象领域中发现各属性联系发挥着重要作用,分类挖掘技术通过有监督的学习探索历史气象数据中潜在的规律,可以提高气象预报模式的准确率。
发明内容
本发明是针对由于数据规模不断增加,随之而来的高维性与不稳定性的问题,提出了一种基于改进决策树算法的降水预测方法,通过改进决策树算法进行训练,使得海量数据进行了充分的利用,提高了预测的准确率,减少误判和漏判问题的发生。
本发明的技术方案为:一种基于改进决策树算法的降水预测方法,具体包括如下步骤:
1)收集数年各地的气象数据,以及相应的降水等级数据;
2)对所得到的气象数据进行归一化处理,得到相应的归一化数据集,对归一化数据集按比例进行划分为训练集与测试集;
3)将训练集带入到改进后的决策树网络中进行训练,将测试集代入到训练完毕后的决策树模型中,检验训练结果,最后将待测数据输入到训练完毕后的决策树网络进行预测,输出结果,评定其降水等级;
所述改进后的决策树网络是将原决策树算法中采用信息熵来进行属性的选择,选择最大属性进行分枝,修改为采用自变量平均影响值来进行选择,即根据属性对结果的影响大小来进行选择,选择影响程度最大的属性进行分枝,改进步骤如下:
3.1)首先,将归一化后的所有训练集M带入到BP网络中进行训练,在BP网络训练终止后,将训练集M中每一自变量特征在其原值的基础上分别增加10%和减少10%构成两个新的训练样本M1和M2;
3.2)然后,将M1和M2分别作为仿真样本利用已建成的BP网络进行仿真,得到两个仿真结果A1和A2,求出A1和A2的差值,即为变动该自变量后对输出产生的影响变化值;
3.3)最后将影响变化值按观测例数平均得出该自变量对于BP网络输出的结果值,将其记为MIV值;
3.4)按照上面步骤依次算出各个自变量的MIV值,最后根据MIV绝对值的大小为各自变量排序,得到各自变量对BP网络输出影响相对重要性的位次表,从而判断出输入特征对于BP网络结果的影响程度,然后选择影响程度最大的属性进行分枝。
本发明的有益效果在于:本发明基于改进决策树算法的降水预测方法,方法以决策树为核心,通过改进决策树算法进行训练,提高了预测的准确率,减少误判和漏判问题的发生。
附图说明
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海理工大学,未经上海理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911012069.5/2.html,转载请声明来源钻瓜专利网。