[发明专利]一种用于空气质量分类的改进随机森林方法有效
申请号: | 201910612178.4 | 申请日: | 2019-07-08 |
公开(公告)号: | CN110334767B | 公开(公告)日: | 2023-02-21 |
发明(设计)人: | 熊庆宇;易华玲;吴丹;吉皇;余洋;高旻;王楷 | 申请(专利权)人: | 重庆大学 |
主分类号: | G06F18/2431 | 分类号: | G06F18/2431;G06F18/214;G01N33/00 |
代理公司: | 重庆西南华渝专利代理有限公司 50270 | 代理人: | 郭桂林 |
地址: | 400044 *** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种用于空气质量分类的改进随机森林方法,包括空气质量分类模型,该空气质量分类模型包括原始数据模块、数据预处理模块、分类生成模块、分类数据模块,其中,原始数据模块用于采集原始空气数据;数据预处理模块用于对原始空气数据进行数据清洗、数据集成、数据转换等操作;分类生成模块用于对数据预处理模块所处理后的数据进行随机采样,并同时基于CART算法分类出决策树;分类数据模块用于接收分类生成模块所输出的分类模型,以及输出空气数据分类结果,所述随机采样包括基于样本类别分组的自助采样方法和随机特征子空间法。本发明提升了少数类样本的分类精度,降低了样本集的整体错分代价。 | ||
搜索关键词: | 一种 用于 空气质量 分类 改进 随机 森林 方法 | ||
【主权项】:
1.一种用于空气质量分类的改进随机森林方法,包括空气质量分类模型,该空气质量分类模型包括原始数据模块(1)、数据预处理模块(2)、分类生成模块(3)、分类数据模块(4),其中,原始数据模块(1)用于采集原始空气数据;数据预处理模块(2)用于对原始空气数据进行数据清洗、数据集成和数据转换;分类生成模块(3)用于对数据预处理模块(2)所处理后的数据进行随机采样,并同时基于CART算法分类出决策树;分类数据模块(4)用于接收分类生成模块(3)所输出的分类模型,以及输出空气数据分类结果(5),其特征在于,随机采样包括基于样本类别分组的自助采样方法和随机特征子空间法,基于样本类别分组的自助采样方法包括以下步骤:S100,在分类生成模块(3)中建立针对空气污染物浓度数据的训练数据集;S200,通过数据预处理模块(2)对前一步骤中训练数据集中的数据进行预处理,包括对数据进行去噪;S300,对前一步骤所处理后的训练数据集进行不平衡指数的计算;S400,基于前一步骤所计算出的不平衡指数与训练数据集的匹配情况,产生新的训练样本集;S500,基于前一步骤中的训练样本集,在分类数据模块(4)中形成相应数量的决策树,并采用多数投票机制获取最终分类结果送达至分类数据模块(4)中。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆大学,未经重庆大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910612178.4/,转载请声明来源钻瓜专利网。