[发明专利]件量预测方法、装置、设备及其存储介质在审
申请号: | 201711429088.9 | 申请日: | 2017-12-25 |
公开(公告)号: | CN109961165A | 公开(公告)日: | 2019-07-02 |
发明(设计)人: | 黄心远;张耀武;王本玉;郭九双;金晶 | 申请(专利权)人: | 顺丰科技有限公司 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q10/08 |
代理公司: | 北京志霖恒远知识产权代理事务所(普通合伙) 11435 | 代理人: | 郭栋梁 |
地址: | 518061 广东省深圳市南山区学府路(以南)*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 预测 随机森林 训练数据集 存储介质 特征属性 验证数据 预设 统计分析 位数调整 预测结果 拟合 创建 申请 验证 | ||
本申请公开了件量预测方法、装置、设备及其存储介质。该方法包括:获取第一预设时间范围的历史件量数据,将历史件量数据划分为训练数据集和验证数据集;基于训练数据集和特征属性,创建随机森林模型;利用随机森林模型对验证数据集进行预测,获得预测百分位数;将第二预设时间范围的历史件量数据输入随机森林模型,按照预测百分位数获取待预测日期的件量。本申请实施例的技术方案,通过区分特殊日期、件量波动异常日期等特征属性,来创建随机森林模型用于预测件量,增强了模型的精准性。并通过统计分析预测结果得到预测百分位数,利用预测百分位数调整模型,解决了现有技术的欠拟合问题,从而降低验证误差。
技术领域
本申请一般涉及计算机领域,具体涉及数据挖掘处理技术领域,尤其涉及件量预测方法、装置、设备及其存储介质。
背景技术
随着物流行业的信息化管理改革的不断深化。面对物流行业的海量数据,物流行业的信息化管理面临着如何有效地从大量复杂的数据中提取有用信息。
数据挖掘技术可以从大量的、模糊的数据中,提取隐含其中的有用信息来分析预测未来的发展,例如,利用普通随机森林算法预测未来某日某营业网点的件量。
但是,利用普通随机森林算法对于不同日期,例如不同月份中不同的工作日或非工作日,目前普遍采用的是大量决策树取平均值的处理方法,该方法缺乏解释性。其次,随机森林算法属于非参数方法,不具有任何可调整性,只能通过提高决策树数量的方法来提高预测准确率,相应地也会付出建模运算时间的代价,从而导致模型效率降低。
因此,亟待提出一种新的方案来解决上述问题。
发明内容
鉴于现有技术中的上述缺陷或不足,期望提供一种在随机森林模型中引入百分位数预测件量的方案。
第一方面,本申请实施例提供了一种件量预测方法,该方法包括:
获取第一预设时间范围的历史件量数据,将历史件量数据划分为训练数据集和验证数据集;
基于训练数据集和特征属性,创建随机森林模型;
利用随机森林模型对验证数据集进行预测,获得预测百分位数;
将第二预设时间范围的历史件量数据输入随机森林模型,按照预测百分位数获取待预测目标日期的件量。
第二方面,本申请实施例提供了一种件量预测装置,该装置包括:
数据获取单元,用于获取第一预设时间范围的历史件量数据,将历史件量数据划分为训练数据集和验证数据集;
模型创建单元,用于基于训练数据集和特征属性,创建随机森林模型;
预测百分位数单元,用于利用随机森林模型对验证数据集进行预测,获得预测百分位数;
件量预测单元,用于将第二预设时间范围的历史件量数据输入随机森林模型,按照预测百分位数获取待预测目标日期的件量。
第三方面,本申请实施例提供了一种设备,包括处理器、存储装置;
前述存储装置,用于存储一个或多个程序;
当前述一个或多个程序被前述处理器执行,使得前述处理器实现本申请实施例描述的方法。
第四方面,本申请实施例提供了一种计算机可读存储介质,其上存储有计算机程序,前述计算机程序被处理器执行时,实现本申请实施例描述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于顺丰科技有限公司,未经顺丰科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711429088.9/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理