[发明专利]基于强化学习的车辆共享服务订单派遣方法及系统在审
申请号: | 202011457620.X | 申请日: | 2020-12-10 |
公开(公告)号: | CN112561104A | 公开(公告)日: | 2021-03-26 |
发明(设计)人: | 李鹏;陈泽强;肖均磊;聂雷 | 申请(专利权)人: | 武汉科技大学 |
主分类号: | G06Q10/02 | 分类号: | G06Q10/02;G06Q10/04;G06Q10/06;G06Q30/06;G06Q50/30;G06N3/04;G06N3/08 |
代理公司: | 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 | 代理人: | 严彦 |
地址: | 430081 湖北*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 强化 学习 车辆 共享 服务 订单 派遣 方法 系统 | ||
1.一个基于强化学习的车辆共享服务订单派遣方法,其特征在于:包括以下步骤,
Step1,收集乘客的信息和车辆的信息,所述乘客的信息包括乘客的起点、目的地、乘客人数以及乘客的最长等待时间,所述车辆的信息包括车辆ID、车辆的当前位置、终点、车辆的剩余座位数量以及车辆的时刻表,车辆的时刻表是包括当前车辆应该去往哪个位置以及车辆接下来要到的所有位置;
Step2,根据乘客的需求,根据乘客的起点和终点同时进行相应限制,搜索满足乘客时空约束的车辆得到候选车辆集合;
Step3,计算所有候选车辆集合中的车辆与当前乘客之间的派遣因素,包括车辆的绕路比、座位利用率、车辆的隐藏收益和未来收益;并且按照车辆的绕路比对所有候选车辆进行升序排列,选择前若干个车辆作为最终候选车辆集合;
Step4,将Step3所得每一辆车的派遣因素输入至深度评估网络中进行评估,对得到的评估结果进行比较,选择评估结果最优的车辆返回给乘客和车辆,如果深度评估网络训练完成,则结束当前次评估,否则,转入Step5;
Step5,结合强化学习策略和梯度下降方法对深度评估网络进行训练,支持返回步骤Step1对下一次实时采集所得乘客的信息和车辆的信息用新的深度评估网络进行评估。
2.根据权利要求1所述基于强化学习的车辆共享服务订单派遣方法,其特征在于:Step2中,采用双向最远半径的车辆搜索方式,实现方式如下,
1)起点单向搜索,包括以乘客的起点为圆心,乘客的最长等待时间和车辆的平均行驶速度的乘积为半径,找到所有在该半径内的车辆,并将车辆放入集合α中;
2)目的地单向搜索,包括以乘客目的地为圆心,阈值ρ为半径,找到所有车辆目的地距离乘客目的地在阈值ρ内的车辆,并将车辆放入集合β中;
3)双向搜索,将既在集合α中又在集合β中的车辆放入最终的车辆候选集合C中。
3.根据权利要求1所述基于强化学习的车辆共享服务订单派遣方法,其特征在于:Step3中,使用动态派遣因素计算方式计算所有候选车辆集合中的车辆与当前乘客之间的派遣因素,实现方式如下,
1)计算车辆完成乘客的绕路比,绕路比的定义为乘客从起点到达目的地的最短距离与车辆实际行驶距离的比值;
2)计算乘客对车辆座位的利用率,座位利用率的定义为乘客的数量与车辆剩余座位的比值;
3)计算车辆搭载乘客的隐藏收益,隐藏收益的定义为车辆前往搭载乘客的路程上为车辆额外带来的收益,包括通过遍历所有在车辆前往乘客所在地的路程上的乘客,并计算这些乘客和当前车辆的路线相似度,选择路线相似度最高的乘客并计算该乘客若搭载当前车辆为当前车辆带来的收益并作为隐藏收益;
4)根据共享方式计算车辆搭载乘客的未来收益,未来收益的定义为由于共享该乘客而增加的路程中为车辆带来的收益。
4.根据权利要求3所述基于强化学习的车辆共享服务订单派遣方法,其特征在于:计算未来收益的实现方式如下,
1)首先根据共享方式计算车辆到达因共享乘客而增加的路程区域的时间段,根据车辆的平均行驶速度和车辆距离目的地的距离计算车辆到达区域所需时间,并得到车辆到达目的区域的时间所属时间段;
2)找到和该时间段以及区域的最相似的K个历史时期,K为预设的取值;
3)对K个历史阶段的乘客和车辆的数量分别求加权平均最终得到预测结果,并将乘客数量与车辆数量的比值作为车辆的未来收益。
5.根据权利要求4所述基于强化学习的车辆共享服务订单派遣方法,其特征在于:所述共享方式包括便车共享、不共享和顺风车共享。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉科技大学,未经武汉科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011457620.X/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理