[发明专利]一种针对大气污染物浓度预测的选择特征的方法在审
申请号: | 201811063979.1 | 申请日: | 2018-09-12 |
公开(公告)号: | CN109190709A | 公开(公告)日: | 2019-01-11 |
发明(设计)人: | 刘博;苏鹏方 | 申请(专利权)人: | 北京工业大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 北京思海天达知识产权代理有限公司 11203 | 代理人: | 沈波 |
地址: | 100124 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 大气污染物 预测 数据集 因果关联规则 污染物数据 历史数据 浓度预测 数据集中 特征子集 污染物 污染物浓度数据 结合神经网络 筛选 方法选择 强相关 弱相关 特征集 冗余 子集 | ||
本发明公开了一种针对大气污染物浓度预测的选择特征的方法,针对想要预测的大气污染物,通过Granger因果关联规则在所有大气污染物的数据集中选出与想要预测的污染物数据集具有Granger因果关联规则的数据集,与要预测的污染物历史数据的数据集一起组成特征子集。本发明从大气污染的大量多为时许数据集中筛选出与想要预测的污染物浓度数据集强联系的其他污染物数据集,从而获得尽可能小的特征集和,筛选掉冗余和弱相关的数据集和作为特征,结合神经网络预测污染物浓度。使用这种方法选择的特征子集针对性强,子集中的数据与预测历史数据存在着强相关联系。
技术领域
本发明属于机器学习领域,尤其涉及一些因果关联规则,以及神经网络特征选择。
背景技术
经典特征选择定义为从N个特征集合中选出M个特征的子集,并满足条件M≤N[1]。它包括特征提取和特征选择两个方面:特征提取广义上指的是一种变换,将处于高维空间的样本通过映射或变换的方式转换到低维空间,达到降维的目的;特征选择指从一组特征中去除冗余或不相关的特征来降维。二者常联合使用,如先通过变换将高维特征空间映射到低维特征空间,然后再去除冗余的和不相关的特征来进一步降低维数。
至今为止,有很多学者从不同角度出发对特征获取进行过定义:Kira定义理想情况下的特征获取为寻找必要的、足以识别目标的最小尺寸特征子集;John从提高预测精度角度定义特征获取为选择特征子集来增加分类精度,或者在不降低分类器精度的条件下降低特征集维数的过程;Koller从类分布的角度定义特征获取为:在保证结果类分布尽可能与原始数据类分布相似的条件下,选择尽可能小的特征子集;Dash给出的定义是选择尽量小尺寸的特征子集,并满足不显著降低分类精度和不显著改变类分布两个条件。
发明内容
本发明要解决的技术问题是,提供一种针对大气污染时间序列选择特征的方法。针对想要预测的大气污染物,通过Granger因果关联规则在所有大气污染物的数据集中选出与想要预测的污染物数据集具有Granger因果关联规则的数据集,与要预测的污染物历史数据的数据集一起组成特征子集。
本发明面向大气污染的大气污染数据集,提出了一种针对大气污染物弄浓度预测的选择特征的方法,从大气污染的大量多为时许数据集中筛选出与想要预测的污染物浓度数据集强联系的其他污染物数据集,从而获得尽可能小的特征集和,筛选掉冗余和弱相关的数据集和作为特征,结合神经网络预测污染物浓度。
为了实现上述目的,本发明采用以下技术方案:首先确定想要预测的大气污染物的数据作为第一层数据集,然后对收集到的中除了第一层数据集的数据集与第一层数据集进行Granger因果检验,寻找与验证集数据存在因果关系的数据集,作为第二层的Granger因果检验数据集,然后再对除了第二层Granger因果检验数据集的与第二层的Granger因果检验数据集进行Granger因果检验,寻找与第二层的Granger因果检验数据集存在因果关系的数据集,作为第三层的Granger因果检验数据集,然后依次循环,直到没有更多一层的Granger因果检验数据集。将所得到的结果以树的数据结构方式存储起来,从而得到对一种污染物浓度预测的具有Granger因果关系多层次的,强联系的数据集和来作为特征。
一种针对大气污染物浓度预测的选择特征的方法包括以下步骤:
步骤1、获取大气污染数据集,并对大气污染数据集中数据进行预处理,得到经过预处理后的大气污染数据集,并且在下面的步骤对本数据集进行操作。
步骤1具体包括以下步骤:
步骤1.1使用最近距离决定填补法填补缺失值,由于大气污染数据为时序数据,并且时间因素对数据变化的影响不明显。所以使用最近距离决定填补法填补缺失值可以有效贴近实际值。
步骤1.2采用离群点分析的方法,通过聚类检测离群点,由于污染物浓度不会突然大幅度变化,所以通过聚类检测离群点,纠正数据,减少数据噪声。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811063979.1/2.html,转载请声明来源钻瓜专利网。