[发明专利]一种基于堆叠选择性集成学习器的空气中细颗粒物PM2.5 有效
申请号: | 201811415764.1 | 申请日: | 2018-11-26 |
公开(公告)号: | CN109615082B | 公开(公告)日: | 2023-05-12 |
发明(设计)人: | 顾锞;乔俊飞 | 申请(专利权)人: | 北京工业大学 |
主分类号: | G06N20/00 | 分类号: | G06N20/00;G01N15/06 |
代理公司: | 北京思海天达知识产权代理有限公司 11203 | 代理人: | 刘萍 |
地址: | 100124 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: |
本发明涉及一种基于堆叠选择性集成学习器的空气中细颗粒物PM |
||
搜索关键词: | 一种 基于 堆叠 选择性 集成 学习 空气 颗粒 pm base sub 2.5 | ||
【主权项】:
1.一种基于堆叠选择性集成学习器的空气中细颗粒物PM2.5的预测方法,其特征在于,包括以下步骤:第一步:收集数据;第二步:设计用于PM2.5浓度预测的堆叠选择性集成学习器模型;第三步:采用修剪技术删除三种类型的学习器中的负向基学习器以实现对各学习器的选择性集成;第四步:对选定的正向基学习器实施堆叠技术,将正向基学习器的结果进行堆叠,以预测未来的PM2.5浓度;第一步中:使用由JAVA语言设计的Android应用程序收集了NO2、O3、PM2.5、PM10、CO、SO2这6种空气污染物的浓度以及湿度、温度、压力、天气、风速、风向这6种气象变量作为原始数据,其中对于天气这一数据进行了量化,将晴、多云、阴、小雨、中雨、大雨、暴雨、雷雨、冻雨、小雪、中雪、大雪、暴雪、雾、沙尘暴这15种天气依次编号为0到14;第二步中:对每个基学习器采用从总训练集中抽取的各不同的子训练集进行训练,使基学习器具有多样性;训练集需体现的多样性为:不同的样本、环境因素和时间因素;对学习器进行训练的数据集需进行进一步的处理以体现这三种多样性;具体步骤是:应用Bagging的方法来完成对样本的抽样操作以实现训练样本的多样性;Bagging的算法框架如下:输入为S、L和NB,其中S代表用于训练的全部样本,每个样本包含12个数据,代表12个变量,L代表学习器,NB表示Bagging方法最大迭代次数,赋值为10;将进行中的迭代次数记为n,令n从1至NB循环,Sn为第n次迭代从S中所提取的自举样本,
为学习器L在Sn中学习的结果,记为
最后,输出多元基学习器
将随机子空间方法应用于环境因素;对特征空间进行随机抽样,使用随机抽取的新的子集训练产生一个新的基学习器,从而将随机抽样应用到特征空间中,建立具有环境因素多样性的多元基学习器;随机子空间的算法框架如下:输入为FR、L和NR,其中FR代表训练样本的特征所组成的集合,即收集到原始数据的6种空气污染物和6种气象变量共计12个数据种类,L代表学习器,NR表示随机子空间方法最大迭代次数,赋值为10;将进行中的迭代次数记为n,令n从1至NR进行循环,
为第n次迭代从F提取出的自举特征,
为学习器L在
中学习的结果,记为
达到迭代次数后,输出多元基学习器
对于时间因素采取以下处理方式;当前时间的训练数据集为T0,当前时间的前一小时的训练数据集为T‑1,当前时间的前两小时的训练数据集为T‑2,当前时间的前三小时的训练数据集为T‑3,以此类推,通过以时间顺序连接原始数据矩阵的方法建立多个子集,分别包含在{T0,T‑1},{T0,T‑1,T‑2},{T0,T‑1,T‑2,T‑3},……中,使用不同的子集训练不同的基学习器;由于该方法为一种全新的方法,现称其为包含子空间方法;包含子空间方法的算法框架如下:输入为FI、L和NI,其中FI代表各时刻的样本特征集,L代表学习器,NI表示包含子空间方法最大迭代次数,赋值为24,代表过去24小时,每小时所收集的样本数据;将进行中的迭代次数记为n,令n从1至NI进行循环,
为第n次迭代提取出的样本,数学表达式为[FI(1),…,FI(n+1)],
为学习器L在
中学习的结果,记为
最后输出多元基学习器![]()
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811415764.1/,转载请声明来源钻瓜专利网。