[发明专利]基于Boosting算法历史数据驱动的包裹交付时长预测方法在审
申请号: | 202110491797.X | 申请日: | 2021-05-06 |
公开(公告)号: | CN113033924A | 公开(公告)日: | 2021-06-25 |
发明(设计)人: | 温兴漳;任卓明 | 申请(专利权)人: | 杭州师范大学 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q10/08;G06F16/245;G06F16/28;G06N3/00 |
代理公司: | 杭州君度专利代理事务所(特殊普通合伙) 33240 | 代理人: | 朱月芬 |
地址: | 311121 浙江省*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 boosting 算法 历史数据 驱动 包裹 交付 预测 方法 | ||
本发明公开一种基于Boosting算法历史数据驱动的包裹交付时长预测方法。本发明包含以下步骤:1、获取下单数据,并对该数据进行整理;2、对获取到的包裹配送数据进行预处理;3、对预处理后的包裹配送数据进行特征提取,依靠数据原始特征创建新特征组成特征数据集;4、将得到的特征数据集,输入预测模型实现包裹交付时长的预测,利用多种评价指标,对模型进行评估,得到完成训练的包裹交付时长预测模型;5、将经过训练得到的包裹交付时长预测模型,用真实的测试数据进行测试,实现包裹交付时长的预测。本发明结合配送中心的相关特征,定义了负载率作为其特征之一来完成配送中心相关特征的构建。解决电商平台给出承诺送达时效不够精确的问题。
技术领域
本发明属于计算机数据处理与分析领域,涉及一种基于Boosting算法历史数据驱动的包裹交付时长预测方法。
背景技术
随着电子商务飞速发展的同时,物流配送体系也正在不断完善。准确的预估相关包裹的到达时间,对于提高用户购物时的体验感,提高包裹的配送效率具有重要意义。在包裹的实际配送路程中,包裹的行程时长与众多因素相关。电子商务平台在给出包裹承诺送达时效时,就具有很大的不确定性。当超过承诺送达时效时,便影响了包裹的配送效率,用户无法在规定的时间内收到包裹,降低了用户的购物体验感,进而影响到电商平台的声誉。
影响包裹交付时长的因素有许多。过去的预测行程时长的工作,大多数依赖于GPS数据以及道路交通状况等信息,但配送中心的作业效率和时间点以及订单量存在着一定的关联,这也是影响包裹交付时长的一大因素。鉴于大数据下的背景,获取到大量的历史物流信息已不是难题。我们依靠大量的历史数据,重点通过构建配送中心相关特征,结合相关Boosting算法,建立包裹交付时长预测模型。
发明内容
本发明的目的在于提供一种基于Boosting算法历史数据驱动的包裹交付时长预测方法。
本发明的技术方案如下:
一种基于Boosting算法历史数据驱动的包裹交付时长预测方法,包含以下步骤:
步骤1、获取数据,并对该数据进行整理。
对获取到的用户数据、订单数据、配送数据。
在整理过程中,对获取的用户数据、订单数据、配送数据的表进行合并处理,得到整理后的包裹配送数据。
所述的合并处理实现如下:
在对三表进行合并处理操作时,使用到的字段有用户唯一标识(user_ID)、订单唯一标识(order_ID)及包裹唯一标识(package_ID)。
首先,使用用户数据和订单数据共有的用户唯一标识(user_ID),对两表进行合并处理。
最后,将上述第一步合并表与配送数据进行合并,使用共有的订单唯一标识(order_ID)及包裹唯一标识性(package_ID)
步骤2、对获取到的包裹配送数据进行预处理。
其中针对包裹配送数据中的异常数据进行剔除,所述的异常数据为实际包裹交付时长与承诺交付时长差值在3天及3天以上的数据样本。
步骤3、对预处理后的包裹配送数据进行特征提取,依靠数据原始特征创建新特征,新特征组成特征数据集;
所述的原始特征包括用户数据、配送数据、订单数据,数据若不经过转换,创建新特征,则会降低实际预测效果。
例如对于订单数据中的时间特征数据,在原始特征中,是以年月日时分秒的格式存储的。若根据该信息创建新的特征,如提取单独月、日、时的信息,对本文预测目标更具有针对性。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州师范大学,未经杭州师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110491797.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于关节四元数的人体分类方法及装置
- 下一篇:一种集成控制柜配电系统
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理