[发明专利]基于LightGBM多元时序分析的城乡垃圾产量分类预测系统在审
申请号: | 202110733043.0 | 申请日: | 2021-06-29 |
公开(公告)号: | CN113393052A | 公开(公告)日: | 2021-09-14 |
发明(设计)人: | 李俐频;赵天瑞;田禹;左薇;黎彦良 | 申请(专利权)人: | 哈尔滨工业大学 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q10/06;G06Q50/26;G06K9/62 |
代理公司: | 哈尔滨华夏松花江知识产权代理有限公司 23213 | 代理人: | 岳昕 |
地址: | 150001 黑龙*** | 国省代码: | 黑龙江;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 lightgbm 多元 时序 分析 城乡 垃圾 产量 分类 预测 系统 | ||
1.基于LightGBM多元时序分析的城乡垃圾产量分类预测系统,其特征在于包括:数据获取模块、特征工程模块、数据归一化模块、模型初始化模块、模型训练模块和预测模块,
所述数据获取模块用于获取原始数据集,所述原始数据集包括因变量数据以及自变量数据,
所述因变量数据包括研究区域垃圾总产量和分类产量数据,
所述自变量数据包括研究区域内每一个行政单位以年为单位的经济发展类数据特征、城镇规划特征、交通旅游特征、能源耗用特征、环境卫生特征以及教育发展特征,以及研究区域以月为单位的工业总产值、一般公共预算收入、一般公共预算支出、社会消费品零售总额、进出口总额、客运总量、社会用电量、第一第二第三产业行业用电量、公共服务用电量、上月垃圾产量数据;
所述特征工程模块用于对原始数据集中的数据进行预处理,所述预处理包括:
一:检查原始数据集中数据是否有空值,若包含空值,则将空值填补为当地前10年数据的平均数;
二:将数据的年份作为数值特征加入原始数据集;
三:将行政区的名称作为类别特征进行LabelEncoder编码后加入原始数据集;
四:增加统计特征,所述统计特征为原始数据集中每一项数据一年内的最大值和平均值,并将自变量数据一年内的最大值和平均值作为数据标签加入原始数据集;
五:将数据集中数值数据进行格式转化,得到整型与浮点型数据格式;
所述数据归一化模块用于对预处理后的数据集进行归一化;
所述模型初始化模块用于初始化LightGBM模型参数;
所述模型训练模块用于根据初始化后的LightGBM模型以及归一化后的数据集得到生活垃圾月产量回归模型;
所述预测模块用于利用生活垃圾月产量回归模型得到垃圾分类预测结果。
2.根据权利要求1所述的基于LightGBM多元时序分析的城乡垃圾产量分类预测系统,其特征在于所述垃圾总产量和分类产量数据包括研究区域生活垃圾年、月产生总量,干垃圾、湿垃圾、有害垃圾、可回收垃圾四类生活垃圾的产生比例。
3.根据权利要求2所述的基于LightGBM多元时序分析的城乡垃圾产量分类预测系统,其特征在于所述经济发展类数据特征包括地区生产总值、第一产业生产值、第二产业生产值、第三产业生产值、第一产业占比、第二产业占比、第三产业占比、农村总产值;
所述城镇规划特征包括城市面积、总人口、城区面积、城市建设面积、城市居住面积、城市绿地面积;
所述交通旅游特征包括客运人数、城市道路里程、公共交通里程、旅游人数、旅游收入;
所述能源耗用特征包括天然气消耗量、天然气用户量、用水总量、用电量、污水排放量;所述环境卫生特征包括公共预算支出、道路保洁面积、环卫车辆数量、公共预算收入;
所述教育发展特征包括学校数量、学生数量、人才引进数量。
4.根据权利要求2所述的基于LightGBM多元时序分析的城乡垃圾产量分类预测系统,其特征在于所述数据归一化模块利用MinMaxScaler函数进行。
5.根据权利要求4所述的基于LightGBM多元时序分析的城乡垃圾产量分类预测系统,其特征在于所述检查原始数据集中数据是否有空值利用isnull函数进行。
6.根据权利要求5所述的基于LightGBM多元时序分析的城乡垃圾产量分类预测系统,其特征在于所述根据初始化后的LightGBM模型以及归一化后的数据集得到生活垃圾月产量回归模型的具体步骤为:
基于Hyperopt进行LightGBM的贝叶斯超参数优化,然后得到模型的最佳树数量和最优树深度,对归一化后的数据集划分验证集与测试集,之后基于sklearn框架导入K-Fold函数,设置五折交叉验证,通过多次拟合与验证,使得验证集和测试集相互形成补集,并利用补集对LightGBM模型不断进行拟合调优,最后得到最优的生活垃圾月产量回归模型。
7.根据权利要求6所述的基于LightGBM多元时序分析的城乡垃圾产量分类预测系统,其特征在于所述对归一化后的数据集划分验证集与测试集利用split函数进行。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工业大学,未经哈尔滨工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110733043.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种DLP生物陶瓷打印浆料
- 下一篇:柔性显示模组及其制备方法、显示装置
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理