[发明专利]基于粒子群参数优化和随机森林的PM2.5浓度预测方法有效
申请号: | 201911004338.3 | 申请日: | 2019-10-22 |
公开(公告)号: | CN110766222B | 公开(公告)日: | 2023-09-19 |
发明(设计)人: | 谢珺;谢新林;何秋生;李松洲;谢刚 | 申请(专利权)人: | 太原科技大学;太原理工大学 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q50/26;G06N3/006 |
代理公司: | 太原科卫专利事务所(普通合伙) 14100 | 代理人: | 朱源;曹一杰 |
地址: | 030024 山*** | 国省代码: | 山西;14 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 粒子 参数 优化 随机 森林 pm2 浓度 预测 方法 | ||
1.一种基于粒子群参数优化和随机森林的PM2.5浓度预测方法,其特征在于,包括如下步骤:
步骤1、获取需要进行预测分析的空气质量数据,并且划分为训练数据集与验证数据集;
步骤2、对获取的数据进行预处理,其中包括缺失值填补、平衡采样;对获取的数据进行缺失值填补时,当一条记录只缺少PM2.5浓度值,使用PM10浓度值代替PM2.5值;
步骤3、初始化粒子群算法的各参数,设置参数如下:群体规模m,每个粒子的位置和速度的取值范围,迭代次数k,设置适应度函数;
步骤4、输入训练集数据和粒子的位置,把粒子的位置设置为二维向量Xi=(x1,x2),令x1=t、x2=f,t和f分别为子树的个数和特征数,用随机森林算法训练预测模型;
步骤5、以验证集数据在训练模型的均方根误差为适应度值,通过粒子群不断优化随机森林的子树的个数t和特征数f,使模型的均方根误差为适应度值最小,得到最终的最优预测模型;修改后的位置和速度的更新公式如下:
xid(k+1)=[xid(k)+Vid(k+1)-0.5]
其中,惯性权重ω=0.75;学习因子c1=c2=1.5;r1和r2是区间[0,1]上的随机数,维度d=1,2;粒子数i=1,2,…,m;k为当前迭代次数;gbest表示粒子群的全局最优位置;Pbest表示粒子群的局部最优位置;
由于随机森林的两个参数子树的个数和所用特征数建模的过程中必须是整数,所以用取整函数使粒子的位置和速度为整数,这样也使模型的最优解为整数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于太原科技大学;太原理工大学,未经太原科技大学;太原理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911004338.3/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理