[发明专利]基于特征提取和改进随机森林的物资需求预测方法在审
申请号: | 202110663038.7 | 申请日: | 2021-06-15 |
公开(公告)号: | CN115481841A | 公开(公告)日: | 2022-12-16 |
发明(设计)人: | 黄振球;黎莫林;江健武;马婉仪;刘康军;陈俊君;邹林宏 | 申请(专利权)人: | 深圳供电局有限公司 |
主分类号: | G06Q10/06 | 分类号: | G06Q10/06;G06Q40/06;G06Q50/06;G06F16/215;G06F40/284;G06F40/30;G06K9/62;G06N20/00 |
代理公司: | 北京天达知识产权代理事务所有限公司 11386 | 代理人: | 李明里 |
地址: | 518000 广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 特征 提取 改进 随机 森林 物资 需求预测 方法 | ||
本发明涉及一种基于特征提取和改进随机森林的物资需求预测方法,包括:导入历史项目数据中的物资需求数据以及与物资需求对应的项目属性数据,进行数据提取得到项目物资历史数据集;基于建立的行业与工程分类知识库,对项目物资历史数据集进行分组;依据项目属性数据对物资在历史项目中的重要性排序,筛选出需进行预测的物资种类;利用与每种所述物资种类对应的物资分组历史数据训练对应的随机森林模型;输入需预测物资的种类,获取该物资的项目属性数据,导入对应的随机森林模型预测该物资的需求量。本发明不仅提高了预测效率,同时提高了非平衡数据的预测性能。
技术领域
本发明涉及物资需求预测和数据处理技术领域,具体涉及一种基于特征提取和改进随机森林的物资需求预测方法。
背景技术
配网物资需求预测是现代电网企业合理制定采购策略,规划发展战略所需的一项重要能力,同时也是提升管理水平,提高运作效率的重要方法。如何科学、合理地进行物资需求预测已逐步成为电网企业的一个重要课题。配网物资需求预测是根据历史的项目物资使用数据,利用数据挖掘技术,探索项目物资使用的内在规律,进而对项目物资的未来需求进行预测,为决策者提供决策依据,有利于提高配网物资管理的精益化水平以及配网物资的运作效率,而且预测的准确性与及时性也制约着物资效率水平的提升。因此,进行准确且及时的物资需求预测具有非常重要的现实意义。
在配网物资需求预测方面,传统的多元回归模型、时间序列预测法等是基于线性技术来进行预测,而对非线性数据的处理不尽合理,效果欠佳;而使用人工智能算法对传统预测方法进行改进,可以全面提取物资序列中的复合特征,进而提高配网物资的预测精度。机器学习、深度学习算法可以通过对配网物资需求历史数据的训练学习,发现一些我们难以发现的特性,使预测更为精确。然而,新的理论技术虽然可以解决非线性、复杂多变的配网物资需求预测问题,但也带来计算量大、参数设计困难及收敛慢等问题。如神经网络模型优化参数较多,在工程领域的应用受到影响,且存在过学习和预测扩展能力不足的缺点。
发明内容
鉴于上述的分析,本发明旨在提供一种基于特征提取和改进随机森林的物资需求预测方法,以提高对配网物资预测的准确率。
本发明提供的技术方案是:
本发明公开了一种基于特征提取和改进随机森林的物资需求预测方法,包括:
导入历史项目数据中的物资需求数据以及与物资需求对应的项目属性数据,进行数据提取得到项目物资历史数据集;
基于建立的行业与工程分类知识库,对项目物资历史数据集进行分组;
依据项目属性数据对物资在历史项目中的重要性排序,筛选出需进行预测的物资种类;
利用与每种所述物资种类对应的物资分组历史数据训练对应的随机森林模型;
输入需预测物资的种类,获取该物资的项目属性数据,导入对应的随机森林模型预测该物资的需求量。
进一步地,所述导入历史项目数据中的物资需求数据以及与物资需求对应的项目属性数据;进行特征提取得到项目物资历史数据集;包括:
基于核K-Means聚类的离群点检测对历史项目数据中物资需求数据以及与物资需求对应的项目属性数据的异常值进行处理,并进行数据清洗和筛选,得到包括物资需求量特征数据和与之对应的年份、项目名称、物资编码、投资金额在内的项目属性数据;
采用自然语言处理的Jieba分词技术对项目属性数据的项目名称进行语义识别、文本分析和分词处理,提取其中所含的地区、站点、行业类型和工程类型在内的特征数据;
将物资需求量特征数据和与之对应的年份、地区、站点、行业类型、工程类型、项目名称、物资编码、投资金额在内的特征数据组成项目物资历史数据集。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳供电局有限公司,未经深圳供电局有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110663038.7/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理