[发明专利]快递收派员的任务规划方法和系统在审
申请号: | 201810052998.8 | 申请日: | 2018-01-19 |
公开(公告)号: | CN108197871A | 公开(公告)日: | 2018-06-22 |
发明(设计)人: | 高磊;倪土;邝展豪;张玉双;刘志欣 | 申请(专利权)人: | 顺丰科技有限公司 |
主分类号: | G06Q10/08 | 分类号: | G06Q10/08;G06Q10/06 |
代理公司: | 北京瑞盟知识产权代理有限公司 11300 | 代理人: | 刘昕 |
地址: | 518000 广东省深圳市南山区学府路(以南)*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 任务规划 快递 快件 强化学习 集合 状态获取单元 反馈单元 排班系统 任务分配 行动路线 规划 | ||
1.一种快递收派员的任务规划方法,根据快件状态和收派员状态规划收派员的任务,包括如下步骤:
获取收派员状态、收派员可采取的行动集合以及所述收派员的任务快件状态;
利用强化学习从所述收派员可采取的行动集合中挑选出收派员下一步采取的最优行动;
将最优行动路线发送给收派员;
其中,所述收派员可采取的行动集合是指收派员到达所有的任务地点和快递集散点的路线集合。
2.根据权利要求1所述的任务规划方法,所述强化学习包括马尔可夫决策过程,所述马尔可夫决策过程由一个四元组构成,所述四元组包括收派员的状态、收派员可采取的行动集合、收派员在当前状态下经过一个行动后转移到下一状态的概率分布、以及收派员采取行动后的回报。
3.根据权利要求2所述的任务规划方法,所述马尔可夫决策过程如下:
收派员在其初始状态下,从所述行动集合中挑选一个任务地点或快递集散点并到达;
收派员完成一个任务后按照所述概率分布转移到下一状态;
收派员执行下一行动,并转移到再下一状态,直至所述行动集合完成。
4.根据权利要求3所述的任务规划方法,所述马尔可夫决策过程的策略由深度神经网络决定,所述策略为收派员可采取的行动集合中收派员下一步最优行动的规则。
5.根据权利要求4所述的任务规划方法,收派员采取任一行动后产生一个相应回报。
6.根据权利要求5所述的任务规划方法,所述策略是通过找到最合适参数,使所述收派员采取的下一步行动最优,所述收派员采取行动后的回报期望值最大。
7.根据权利要求1所述的任务规划方法,所述快件状态包括:快件起始时间窗、快件数量、起始地址、到达时间要求和快件其他信息。
8.根据权利要求1所述的任务规划方法,所述收派员状态包括收派员所处的位置、收派员的任务快件状态、同收派任务片区内其他收派员的状态。
9.一种快递收派员的任务规划系统,根据快件状态和收派员状态规划收派员的任务,包括状态获取单元、强化学习单元和反馈单元,
所述状态获取单元获取收派员状态、收派员可采取的行动集合以及所述收派员的任务快件状态;
所述强化学习单元从所述收派员可采取的行动集合中挑选出收派员下一步采取的最优行动;
所述反馈单元将最优行动路线发送给收派员;
其中,所述收派员可采取的行动集合是指收派员到达所有的任务地点和快递集散点的路线集合。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于顺丰科技有限公司,未经顺丰科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810052998.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:智能信包箱系统
- 下一篇:一种运输计划自动排期方法
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理