[发明专利]一种基于机器学习的空气质量预报方法和装置在审
申请号: | 201910420235.9 | 申请日: | 2019-05-20 |
公开(公告)号: | CN110334732A | 公开(公告)日: | 2019-10-15 |
发明(设计)人: | 郑龙;贾磊;刘贻华 | 申请(专利权)人: | 北京思路创新科技有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G01N33/00 |
代理公司: | 中国和平利用军工技术协会专利中心 11215 | 代理人: | 刘光德;彭霜 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提出一种基于机器学习的空气质量预报方法,其对气象数据和污染物数据进行数据清洗,针对每一个指标,分别分析其数据分布,按照站点以及污染物等级对缺失的时间序列对应的缺失的气象数据和污染物数据的值进行填充,对经过清洗和填充的污染数据进行特征工程;将经过上述特征工程后的历史污染物检测数据和气象数据进行合并,生成训练样本文件;将经过特征选择后的样本文件作为输入,应用于XGBoost模型得到经过训练的XGBoost模型;将待预测的预报数据输入经过训练的模型,得到输出数据,完成空气质量预报,相对于过去的模型,准确性有了极大提高,且适应性强。 | ||
搜索关键词: | 气象数据 污染物数据 基于机器 填充 预报 方法和装置 污染物检测 时间序列 输出数据 数据分布 数据清洗 特征选择 污染数据 训练样本 样本文件 预报数据 过去的 清洗 污染物 站点 合并 学习 预测 应用 分析 | ||
【主权项】:
1.一种基于机器学习的空气质量预报方法,其特征在于,所述方法包括:对气象数据和污染物数据进行数据清洗,针对每一个指标,分别分析其数据分布;按照站点以及污染物等级对缺失的时间序列对应的缺失的气象数据和污染物数据的值进行填充;对经过清洗和填充的污染数据进行特征工程;将经过上述特征工程后的历史污染物检测数据和气象数据进行合并,生成训练样本文件;利用SMOTE方法对训练样本文件进行重采样;对样本文件按照污染物进行相关性分析,并按相关性进行降序排列,得到各污染物特征列表;将各污染物特征列表应用贪心算法进行特征选择;将经过特征选择后的数据作为输入,应用于XGBoost模型得到经过训练的XGBoost模型;将待预测的预报数据输入经过训练的模型,得到输出数据,完成空气质量预报。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京思路创新科技有限公司,未经北京思路创新科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910420235.9/,转载请声明来源钻瓜专利网。