[发明专利]基于相关性分析和数据均衡的能见度分层预测模型在审
申请号: | 202010695781.6 | 申请日: | 2020-07-20 |
公开(公告)号: | CN111832230A | 公开(公告)日: | 2020-10-27 |
发明(设计)人: | 陆冰鉴;王兴;詹少伟;苗春生;周可;薛丰昌;张越 | 申请(专利权)人: | 南京信大气象科学技术研究院有限公司 |
主分类号: | G06F30/27 | 分类号: | G06F30/27;G06N3/04;G06N3/08;G06K9/62 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 210044 江苏省南京市江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 相关性 分析 数据 均衡 能见度 分层 预测 模型 | ||
基于相关性分析和数据均衡的能见度分层预测模型,模型建立步骤如下:采集气象站观测数据,通过相关性分析挑选出与能见度相关性较大的因子,形成数据样本;处理数据样本,得到训练样本和测试样本;按照能见度类别划分标准训练样本进行统计分析,通过随机下采样的方法均衡各类样本,得到新的训练样本;通过长短期记忆神经网络(LSTM)分类模型对新的训练样本进行样本分类;将分类结果及对应的类别训练样本输入基于LSTM的回归模型中,选择每类对应的子类样本,最终回归出能见度。本发明提出的基于相关性分析和数据均衡的能见度分层预测算法模型提高了网络的泛化能力,从而提高能见度类别预测的准确率,降低能见度预测的误差,具有较高的应用价值。
技术领域
本发明涉及气象监测领域,特别涉及基于相关性分析和数据均衡的能见度分层预测模型。
背景技术
大气能见度(Visibility)是反映大气透明度的一个指标。一般定义为具有正常视力的人在当时的天气条件下还能够看清楚目标轮廓的最大地面水平距离。大气能见度是气象监测中的一项重要指标,在道路通行、航海、航空和环境保护监测等领域应用较广。20世纪60年代第二次工业革命以来,随着人类生产生活对化石能源的消耗剧增,排放到大气中的颗粒物如PM2.5、PM10越来越多,这些颗粒物凝结核形成的气溶胶降低了大气能见度,影响了交通运输业的安全运行,是导致交通事故的主要气象影响因子。在海洋和内河运输业中,大约三分之一的船舶相撞事故都是由能见度低导致的,虽然现代航船上有先进的导航系统,但低能见度仍然是一个不可忽视的隐患。
当前,能见度预报仍以天气图分析预报、经验预报和数值预报为主。随着数值预报的发展,现在也有数值释用和雾模式预报等。数值释用要先了解污染物浓度和变化规律,再计算能见度。由于影响污染物浓度变化的因素和变化规律较难掌握,加上计算量较大,该方法在业务应用中开展缓慢。而雾模式仅有一定的机理分析用途,难以进行实际预报。近年来,学者们引入了神经网络、支持向量机、线性与非线性回归等方法。
申请号CN201711238429.4提出了一种大气能见度预测方法,根据收集的历年气象数据,构建新的气象数据集;利用新的气象数据集训练支持向量机,得到支持向量机训练模型;利用新的气象数据集训练决策树,得到决策树模型;将待预测数据归一化处理后输入至训练过后的支持向量机训练模型,由支持向量机训练模型分类过后输入至相应的训练后的决策树模型,得到最终的大气能见度预测数据。
上述专利预测能见度的方法未能解决样本不均衡,低能见度预报不准确的问题。
发明内容
为克服上述现有技术中的不足,本发明目的在于提供一种基于相关性分析和数据均衡的能见度分层预测模型。
为实现上述目的及其他相关目的,本发明提供的技术方案是:基于相关性分析和数据均衡的能见度分层预测模型,其特征在于,建立步骤如下:
S1.采集气象站观测数据,通过相关性分析挑选出与能见度相关性较大的因子,形成数据样本;
S2.处理步骤1中的数据样本,得到训练样本和测试样本;
S3.按照能见度类别划分标准对步骤2中得到的训练样本进行统计分析,通过随机下采样的方法均衡各类样本,得到新的训练样本;
S4.通过长短期记忆神经网络(LSTM)分类模型对步骤3中得到的新的训练样本进行样本分类;
S5.将步骤4中的分类结果及对应的类别训练样本输入基于LSTM的回归模型中,选择每类对应的子类样本,最终回归出能见度。
优选的技术方案为:步骤1中,首先,采集气象站历史观测数据,处理出各项气象因子输入项及能见度输出项,用作训练及测试;
然后,对输入项及能见度输出项做相关性分析,挑选出与能见度相关性较大的因子,相关性分析通过SPSS软件计算Pearson相关系数分析得出,挑选相关性较大的因子作为输入因子;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京信大气象科学技术研究院有限公司,未经南京信大气象科学技术研究院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010695781.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种针织高弹高回复拉毛面料工艺
- 下一篇:一种炼焦配煤的配方
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置