[发明专利]常规化时空调度价值估计在审
申请号: | 201980097591.X | 申请日: | 2019-06-14 |
公开(公告)号: | CN114026578A | 公开(公告)日: | 2022-02-08 |
发明(设计)人: | 唐小程;秦志伟;叶杰平 | 申请(专利权)人: | 北京嘀嘀无限科技发展有限公司 |
主分类号: | G06Q10/06 | 分类号: | G06Q10/06;G06Q50/30 |
代理公司: | 永新专利商标代理有限公司 72002 | 代理人: | 李隆涛 |
地址: | 100193 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 常规 时空 调度 价值 估计 | ||
1.一种用于评估订单调度政策的系统,所述系统包括:
用于生成与驾驶员相关联的历史驾驶员数据的计算装置;
至少一个处理器;以及
存储指令的存储器,指令当由所述至少一个处理器执行时使所述至少一个处理器执行操作,所述操作包括:
获得所生成的与驾驶员相关联的历史驾驶员数据,
至少部分地基于所获得的历史驾驶员数据来估计与多个订单调度政策相关联的价值函数,以及
确定最佳订单调度政策,最佳订单调度政策与估计出的价值函数的最大值相关联。
2.根据权利要求1所述的系统,其中,所生成的历史驾驶员数据包括与驾驶员相关联的环境状态,环境状态包括驾驶员的时空状态和情境特征向量,情境特征向量与驾驶员的时空状态相关联。
3.根据权利要求2所述的系统,其中,情境特征向量指示出驾驶员的时空状态的附近的静态属性和供求信息。
4.根据权利要求2所述的系统,其中,所生成的历史驾驶员数据进一步包括驾驶员可用的选项,选项指示出驾驶员从第一时空状态过渡到第二时空状态,第二时空状态在时间上比第一时空状态更晚。
5.根据权利要求4所述的系统,其中,所生成的历史驾驶员数据进一步包括奖励,奖励指示出驾驶员从第一时空状态过渡到第二时空状态的持续时间内的总回报。
6.根据权利要求1所述的系统,其中,估计与多个订单调度政策相关联的价值函数进一步包括迭代地纳入训练数据并在每个迭代中更新价值函数的估计。
7.根据权利要求6所述的系统,其中,在每个迭代中更新价值函数的估计应用前馈中性网络。
8.根据权利要求7所述的系统,其中,前馈中性网络通过可训练权重矩阵进行参数化。
9.根据权利要求8所述的系统,其中,估计与多个订单调度政策相关联的价值函数进一步包括定期同步权重矩阵。
10.根据权利要求7所述的系统,其中,前馈中性网络包括惩罚参数和惩罚项。
11.一种评估订单调度政策的方法,所述方法包括:
生成与驾驶员相关联的历史驾驶员数据;
至少部分地基于所生成的历史驾驶员数据来估计与多个订单调度政策相关联的价值函数;以及
确定最佳订单调度政策,最佳订单调度政策与估计出的价值函数的最大值相关联。
12.根据权利要求11所述的系统,其中,所生成的历史驾驶员数据包括与驾驶员相关联的环境状态,环境状态包括驾驶员的时空状态和情境特征向量,情境特征向量与驾驶员的时空状态相关联。
13.根据权利要求12所述的系统,其中,情境特征向量指示出驾驶员的时空状态的附近的静态属性和供求信息。
14.根据权利要求12所述的系统,其中,所生成的历史驾驶员数据进一步包括驾驶员可用的选项,选项指示出驾驶员从第一时空状态过渡到第二时空状态,第二时空状态在时间上比第一时空状态更晚。
15.根据权利要求14所述的系统,其中,所生成的历史驾驶员数据进一步包括奖励,奖励指示出驾驶员从第一时空状态过渡到第二时空状态的持续时间内的总回报。
16.根据权利要求11所述的系统,其中,估计与多个订单调度政策相关联的价值函数进一步包括迭代地纳入训练数据并在每个迭代中更新价值函数的估计。
17.根据权利要求16所述的系统,其中,在每个迭代中更新价值函数的估计应用前馈中性网络。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京嘀嘀无限科技发展有限公司,未经北京嘀嘀无限科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201980097591.X/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理