[发明专利]一种车辆动态合乘匹配方法、系统、介质、设备及终端在审
申请号: | 202111490993.1 | 申请日: | 2021-12-08 |
公开(公告)号: | CN114169608A | 公开(公告)日: | 2022-03-11 |
发明(设计)人: | 钟其水;施开波;白金平;杨金;韩胜;李思捷 | 申请(专利权)人: | 电子科技大学长三角研究院(湖州) |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06F16/9537;G06N3/04;G06N3/08 |
代理公司: | 成都东恒知盛知识产权代理事务所(特殊普通合伙) 51304 | 代理人: | 李英 |
地址: | 313000 浙江省湖州*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 车辆 动态 匹配 方法 系统 介质 设备 终端 | ||
1.一种车辆动态合乘匹配方法,其特征在于,所述车辆动态合乘匹配方法包括以下步骤:
步骤一,环境状态定义;
步骤二,道路环境搭建;
步骤三,基于经验重放的DQN算法构建;
步骤四,基于先验知识的经验池设计,获取车辆最佳动态。
2.如权利要求1所述的车辆动态合乘匹配方法,其特征在于,所述步骤一中的环境状态定义包括:
描述车辆动态合乘系统的状态的因素包括系统内不断变化的订单请求信息和车辆的行驶状态;在车辆合乘系统中,乘客的请求信息实时进入车辆合乘系统,调度中心根据新请求的具体信息以及可用车辆的任务链,在满足所有请求时间窗约束的前提下将请求与最合适的车辆进行匹配;
在路网上,Gt(V,Et)用于表示车辆的交互信息,其中V{1,...,N}为道路节点的集合,为边的集合;一条边(i,j)∈Et代表节点i和节点j之间是连通的,即在t时刻从节点i转移到节点j;
定义路网上的N个节点为状态空间;根据路网节点的位置,定义动作空间为A={上,下,左,右},分别代表车辆行驶的相对方向;
奖励值是车辆学习知识的主要来源,车辆根据奖励函数与环境交互并通过得到的奖励值调整行动策略,故奖励函数是否合适会直接影响车辆表现的好坏;设置上车点位置奖励为5,下车点位值为10,即为多目标点路径优化,并且车辆只能先到达上车点再到达下车点,非目标点值每移动一个点奖励值减1,表示车辆自身的消耗。
3.如权利要求1所述的车辆动态合乘匹配方法,其特征在于,所述步骤二中的道路环境搭建包括:
构建基于Node2Vec的道路模型构造算法,使得道路节点间的关系以向量形式送给神经网络,并加速网络训练;
(1)信息网络模型构建
①信息网络:抽象为节点与边的集合组成的有向图G(N,B),其中N(n1,n2,...,nn)为网络中所有节点的集合;为网络中所有连接节点的边的集合;对于网络中的每一条边,均存在对应的权值si,j;当两个节点相连时,对于无权图si,j=1,有权图si,j>0;两个节点不相连时,si,j=0;
②邻接矩阵:表示网络中节点之间相邻关系的矩阵,使用A∈Rn×n表示;如果(ni,nj)∈G即边bi,j存在在图G中,则定义Ai,j=1;否则,如果该边不存在于图G中,则Ai,j=0;
③同构网络:道路交通运输网络属于同构网络;
④网络密度:用于描述网络中节点间相互连接的紧密程度;在一个由N个节点和L条边组成的网络中,网络密度为:
⑤网络平均密度:网络中节点的度表示所有与该节点相连的边的数量,两个节点各占据一条边的一半,每个节点的度均为1/2;其中网络平均度则表示为网络中边数与节点数比值的两倍,两个节点之间边的途径越多,其网络平均度越大,即在一个由N个节点和L条边组成的网络中,网络平均度为:
(2)Node2Vec算法构建
Node2Vec通过设置两个方向性的参数p,q分别给图中的节点连接的各条边分配不同的权值,通过设定不同的权值指导深度游走或者广度游走,实现指定游走是更趋向于深度优先遍历DFS还是更趋向广度优先遍历BFS;
DeepWalk算法将深度学习的神经网络技术引入网络表示学习中,通过将图中按一定顺序随机游走序列的节点序列数据作为word2vec模型的输入,采用skip-gram的方法为网络提取特征;DeepWalk通过随机游走算法生成{vi-w,...,vi-1,vi,vi+1,...,vi+w-1,vi+w}的节点序列,其中w为窗口大小,计算由中间节点vi分别生成两边节点的概率,由此得到每个节点的向量表示,该算法的损失函数为:
其中,
Node2Vec在Deepwalk算法随机游走的基础上引入超参数p、q,采用BFS和DFS生成节点序列数据;假设上一次游走的边是从节点t到节点v,Node2Vec算法根据不同的p和q的取值决定了节点v的邻居节点,v的前节点t除外的游走概率,超参数p又称返回概率控制节点下一次游走到达的节点是返回节点t的邻居节点x1的概率,超参数q又称出入概率控制节点下一次游走到达的节点是t节点的非邻居节点x2或x3的概率,概率值由下式可得:
式中,dtx表示节点t和x之间的最短距离;
(3)基于Node2Vec框架的城市路网搭建
采用Node2Vec算法构建道路环境,以图嵌入的形式送给神经网络;道路环境搭建部分仿真通过Python语言实现,并使用NetworkX包,Scikit-learn机器学习框架,Word2vec与Node2vec模型;其中随机游走序列的生成采用图嵌入里面的Node2vec模型进行生成,Skip-gram模型采用Word2vec模型中的随机梯度下降法SGD的方法进行优化;
根据训练过程,通过网络表示学习得到真实芝加哥城市交通主干道的节点向量表示形式,作为本发明DQN算法神经网络的输入。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学长三角研究院(湖州),未经电子科技大学长三角研究院(湖州)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111490993.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种智能关键数据属性融合方法及系统
- 下一篇:一种采样针管路及采样判断方法
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理