[发明专利]基于XGBoost模型的客户下单重量预测方法及系统有效
申请号: | 201910655746.9 | 申请日: | 2019-07-19 |
公开(公告)号: | CN110543963B | 公开(公告)日: | 2022-08-05 |
发明(设计)人: | 龚泳旭 | 申请(专利权)人: | 深圳市跨越新科技有限公司 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q10/08 |
代理公司: | 深圳国新南方知识产权代理有限公司 44374 | 代理人: | 周雷 |
地址: | 518000 广东省深圳市宝安区航城*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 xgboost 模型 客户 重量 预测 方法 系统 | ||
1.一种基于XGBoost模型的客户下单重量预测方法,其特征在于,包括:
根据客户历史下单数据中的实际重量与预设重量基准值、下单绝对偏差与预设偏差阈值及实际重量预设占比的关系预先构建下单不准客户名单;
利用预先构建的下单不准客户名单判断当前下单客户是否为下单不准客户;
若当前下单客户为下单不准客户,获取该客户当前下单和历史下单数据;
结合所述当前下单和历史下单数据进行特征工程,构建与当前下单关联的入模特征变量;所述特征工程构建的入模特征变量包括:当前下单的重量、件数、时间、下单渠道,以及基于历史下单数据统计出来的截止当前下单的最大实际重量、最小实际重量、历史实际件数最大值、历史实际件数最小值、所有订单实际重量总和、实际重量平均值、历史实际件数平均值、实际重量中位数、实际重量上四分位数、实际重量下四分位数、历史实际件数上四分位数、历史实际件数下四分位数,以及截止当前下单最后3笔的实际重量总和、实际件数总和、实际重量平均值和下单单件货实际重量平均值与当前下单下单件数的积,以及截止当前下单最后5笔的实际重量总和、实际件数总和、实际重量平均值和下单单件货实际重量平均值与当前下单下单件数的积,以及上一笔下单单件货实际重量平均值与当前下单下单件数的积;
根据当前下单重量所属重量区间,将当前下单关联的入模特征变量输入至相应的训练好的XGBoost模型中,得到下单重量预测值,所述重量区间预先划分,每个重量区间对应一个XGBoost子模型,所述XGBoost子模型根据各个重量区间对应的历史下单数据训练得到。
2.根据权利要求1所述的基于XGBoost模型的客户下单重量预测方法,其特征在于,所述判断当前下单客户是否为下单不准客户之前,先对XGBoost模型进行训练,包括:
获取所有客户的历史下单数据;
基于所有客户的历史下单数据进行特征工程,构建入模特征变量集;
设定下单重量第一重量区间、第二重量区间和第三重量区间;
将下单重量位于第一重量区间的历史下单数据及所对应的入模特征变量输入至XGBoost模型进行训练,得到XGBoost第一子模型;
将下单重量位于第二重量区间的历史下单数据及所对应的入模特征变量输入至XGBoost模型进行训练,得到XGBoost第二子模型;
将下单重量位于第三重量区间的历史下单数据及所对应的入模特征变量输入至XGBoost模型进行训练,得到XGBoost第三子模型。
3.根据权利要求2所述的基于XGBoost模型的客户下单重量预测方法,其特征在于,所述基于所有客户的历史下单数据进行特征工程之前,先对历史下单数据中的下单重量和下单件数进行数据清洗,包括:
若客户当笔下单的下单重量为零,则将该笔下单的下单重量替换为该客户历史下单数据中记录的下单最小实际重量;若客户当笔下单的下单重量大于预设下单重量阈值,则将该笔下单的下单重量替换为该客户历史下单数据中记录的所有下单实际重量的中位数;
若客户当笔下单的下单件数为零,则将该笔下单的下单件数替换为该客户历史下单数据中记录的下单最小实际件数;若客户当笔下单的下单件数大于预设下单件数阈值,则将该笔下单的下单件数替换为该客户历史下单数据中记录的所有下单实际件数的中位数。
4.根据权利要求2所述的基于XGBoost模型的客户下单重量预测方法,其特征在于,所述根据当前下单重量所属重量区间,将当前下单关联的入模特征变量输入至相应的训练好的XGBoost模型中,包括:
当前下单重量属于所述第一重量区间时,将所述当前下单关联的入模特征变量输入至训练好的XGBoost第一子模型中;
当前下单重量属于所述第二重量区间时,将所述当前下单关联的入模特征变量输入至训练好的XGBoost第二子模型中;
当前下单重量属于所述第三重量区间时,将所述当前下单关联的入模特征变量输入至训练好的XGBoost第三子模型中。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市跨越新科技有限公司,未经深圳市跨越新科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910655746.9/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理