[发明专利]基于决策树索引的神经网络预测空气质量的方法有效
申请号: | 201910630581.X | 申请日: | 2019-07-12 |
公开(公告)号: | CN110363347B | 公开(公告)日: | 2022-04-15 |
发明(设计)人: | 林宣雄;许秋飞;杭怡春;崔平 | 申请(专利权)人: | 江苏天长环保科技有限公司 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06N3/04;G06N3/08;G01N15/06;G01N33/00 |
代理公司: | 常州唯思百得知识产权代理事务所(普通合伙) 32325 | 代理人: | 金辉 |
地址: | 214000 江苏省无锡市*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 决策树 索引 神经网络 预测 空气质量 方法 | ||
1.一种基于决策树索引的神经网络预测空气质量的方法,其特征在于,包括以下步骤:
(1)建立相关气象因子、空气质量和大气污染物排放量的时间序列数据集;
(2)利用决策树DT算法对获取的训练样本进行分类,生成以空气质量特征为导向的最优树形结构Tα及其相应分类结果;
(3)根据所述分类结果,为每一分类建立一个BP神经网络模型,并进行模型训练;
(4)输入预测数据集,基于决策树分类索引,选择训练后的DT-BP神经网络模型或综合BP神经网络模型对空气质量进行预测,具体为:对给定的预测样本观测序列,根据模型预先设定的决策树分类判定其所属类别;对符合决策树分类规则的预测样本,通过训练后的DT-BP神经网络模型进行空气质量预测,计算出t时刻的污染物浓度值或AQI值;对不符合决策树分类规则的预测样本,通过训练后的综合BP神经网络模型进行空气质量预测,计算出t时刻的污染物浓度值或AQI值,其中所述综合BP神经网络模型,是指由未经决策树分类的全部训练数据集建立并训练的BP神经网络模型,其中,给定的预测样本观测序列包括从中国气象部门权威发布机构获得城市级未来24小时、未来72小时逐时天气预报,获取城市空气质量监测站点实时空气质量监测数据,以及获取城市大气污染物工业排放量实时监测数据;
(5)基于迭代算法得到连续的空气质量预报结果,包括:基于迭代的策略,用t时刻的预测值作为t+1时刻的输入值,预测t+1时刻的空气质量,由此得到连续的空气质量预报结果;
(6)记录出现不满足决策树分类匹配规则的数据集次数,超过设定值自动启动模型更新,包括:记录出现不满足决策树分类规则的数据集次数λ,当λ大于设定值时,自动加载自模型建立起到当前时间内,所有新建立的包含气象因子、空气质量监测数据、大气污染物工业排放量的时间序列数据集至训练数据库,重复步骤(2)和(3),建立新的DT-BP神经网络模型。
2.根据权利要求1所述的基于决策树索引的神经网络预测空气质量的方法,其特征在于:所述步骤(2)中,根据训练样本时间序列数据集,从根节点开始,用基尼指数最小化准则进行特征选择,递归构建二叉决策树。
3.根据权利要求2所述的基于决策树索引的神经网络预测空气质量的方法,其特征在于:所述递归构建二叉决策树具体步骤为:
1)设节点的训练样本时间序列数据集为D,计算现有特征对该训练样本时间序列数据集的基尼指数,此时,对每一个特征A,对其可能取的每个值a,根据样本点对A=a的测试为“是”或“否”,将D分割成D1和D2两部分,其中D1={(x,y)∈D∣A(x)=a},D2=D-D1,利用公式
计算A=a时,集合D的基尼指数Gini(D,A);
2)在所有可能的特征A以及它们所有可能的切分点a中,选择基尼指数最小的特征及其对应的切分点作为最优特征与最优切分点,依最优特征与最优切分点,从现节点生成两个子节点,将训练样本时间序列数据集依特征分配到两个子节点中去;
3)对两个子节点递归地调用步骤1)-2),直至节点中样本个数小于预定阈值,或者样本基尼指数小于预定阈值,或没有更多的特征;
4)生成决策树。
4.根据权利要求3所述的基于决策树索引的神经网络预测空气质量的方法,其特征在于,从所述步骤4)生成的决策树底端剪去一些子树使得模型简化,具体步骤为:
A、剪枝形成子树序列:从决策树T0底端开始不断剪枝,直到T0的根节点,形成子树序列{T0,T1,…,Tn};
B、选择最优子树:利用独立的验证数据集测试子树序列中各棵子树的平方误差或者基尼指数,其最小的决策树被认为是最优的决策树;每一棵子树都对应一个参数α,最优子树Tk确定,αk确定,即最优子树Tα;
C、根据确定的最优子树Tα,对所述给定的预测样本观测序列划分到相应的子树中,得到DT分类结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江苏天长环保科技有限公司,未经江苏天长环保科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910630581.X/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理