[发明专利]一种基于机器学习的空气质量预报方法和装置在审
申请号: | 201910420235.9 | 申请日: | 2019-05-20 |
公开(公告)号: | CN110334732A | 公开(公告)日: | 2019-10-15 |
发明(设计)人: | 郑龙;贾磊;刘贻华 | 申请(专利权)人: | 北京思路创新科技有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G01N33/00 |
代理公司: | 中国和平利用军工技术协会专利中心 11215 | 代理人: | 刘光德;彭霜 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 气象数据 污染物数据 基于机器 填充 预报 方法和装置 污染物检测 时间序列 输出数据 数据分布 数据清洗 特征选择 污染数据 训练样本 样本文件 预报数据 过去的 清洗 污染物 站点 合并 学习 预测 应用 分析 | ||
1.一种基于机器学习的空气质量预报方法,其特征在于,所述方法包括:对气象数据和污染物数据进行数据清洗,针对每一个指标,分别分析其数据分布;按照站点以及污染物等级对缺失的时间序列对应的缺失的气象数据和污染物数据的值进行填充;对经过清洗和填充的污染数据进行特征工程;将经过上述特征工程后的历史污染物检测数据和气象数据进行合并,生成训练样本文件;利用SMOTE方法对训练样本文件进行重采样;对样本文件按照污染物进行相关性分析,并按相关性进行降序排列,得到各污染物特征列表;将各污染物特征列表应用贪心算法进行特征选择;将经过特征选择后的数据作为输入,应用于XGBoost模型得到经过训练的XGBoost模型;将待预测的预报数据输入经过训练的模型,得到输出数据,完成空气质量预报。
2.根据权利要求1所述的方法,其特征在于,按照站点以及污染物等级对缺失的时间序列对应的缺失的气象数据和污染物数据的值进行填充包括:利用线性插值、前向插值、后向插值的方法对缺失的时间序列对应的缺失的气象数据和污染物数据的值进行填充。
3.根据权利要求1所述的方法,其特征在于,对经过清洗和填充的污染数据进行特征工程包括:当空气质量预报为以小时单位的预报时,对污染物历史数据计算其8小时滑动均值,然后对得到的污染物全量数据向下平移24小时得到前一天的污染物浓度数据;分别按站点计算历史数据中当天气象要素中的不同气压下的气温、露点温度、湿度、风速、风向、长波辐射以及边界层高度的24小时滑动均值、24小时滑动变化量、滑动最大值、滑动最小值、以及当天的极差;并按站点计算历史数据中当天气象要素中当天主导风向。
4.根据权利要求1所述的方法,其特征在于,对经过清洗和填充的污染数据进行特征工程包括:当空气质量预报为以天单位的预报时,对得到的污染物全量数据向下平移24小时得到前一天的污染物浓度数据;分别按站点计算历史数据中当天气象要素中的不同气压下的气温、露点温度、湿度、风速、风向、长波辐射以及边界层高度的日均值、当天和前一天的滑动变量、当天最大值、当天最小值、以及当天的极差;并按站点计算历史数据中当天气象要素中当天主导风向。
5.根据权利要求1所述的方法,其特征在于,对需要预报的污染物分别在应用贪心算法进行特征选择包括:利用提取的各污染物特征列表中特征的均方根误差rmse实现特征选择。
6.根据权利要求1所述的方法,其特征在于,还包括对XGBoost模型优化包括运用GridSearchCV的方法寻找最佳超参数,并设置early stoping规则。
7.一种基于机器学习的空气质量预报装置,其特征在于,所述装置包括:
数据清洗模块,用于对气象数据和污染物数据进行数据清洗,针对每一个指标分别进行分析其数据分布;
数据填充模块,用于按照站点以及污染物等级对缺失的时间序列对应的缺失的气象数据和污染物数据进行填充;对经过清洗和填充的污染数据进行特征工程;
训练样本生成模块,用于将经过上述特征工程后的历史污染物检测数据和气象数据进行合并,生成训练样本文件;
重采样模块,用于利用SMOTE方法对训练样本文件进行重采样;对样本文件按照污染物进行相关性分析,并按相关性进行降序排列,得到各污染物特征列表;
特征选择模块,用于将各污染物特征列表应用贪心算法进行特征选择;
模型训练模块,用于将经过特征选择后的数据作为输入,应用于XGBoost模型得到经过训练的XGBoost模型;
空气质量预报模块,用于将待预测的预报数据输入经过训练的模型,得到输出数据,完成空气质量预报。
8.一种计算机可读存储介质,其特征在于:所述存储介质存储有计算机程序,所述计算机程序被处理器执行,以实现权利要求1至6任意一项的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京思路创新科技有限公司,未经北京思路创新科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910420235.9/1.html,转载请声明来源钻瓜专利网。