[发明专利]一种控制车辆行驶的方法、设备和装置在审
申请号: | 202310266544.1 | 申请日: | 2023-03-13 |
公开(公告)号: | CN116203964A | 公开(公告)日: | 2023-06-02 |
发明(设计)人: | 于宁;潘屹峰 | 申请(专利权)人: | 阿波罗智联(北京)科技有限公司 |
主分类号: | G05D1/02 | 分类号: | G05D1/02 |
代理公司: | 北京猷德知识产权代理有限公司 16084 | 代理人: | 范继晨 |
地址: | 100176 北京市大兴区经济*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 控制 车辆 行驶 方法 设备 装置 | ||
1.一种控制车辆行驶的方法,包括:
获取目标车辆的导航行驶轨迹,以及所述目标车辆所处当前环境的当前环境信息,其中,所述当前环境信息至少包括:所述当前环境对应的交通信息、所述目标车辆与所述当前环境中的障碍车辆之间的交互信息;
根据所述当前环境信息确定所述目标车辆与所述障碍车辆之间进行交互的回报数据,其中,所述回报数据表征了所述目标车辆在所述交互场景下的驾驶性能;
基于目标树结构及所述回报数据确定至少一个候选节点,其中,所述目标树结构由多个节点组成,每个节点表征了所述目标车辆在每个时刻的控制量;
基于所述至少一个候选节点确定控制所述目标车辆行驶的目标控制序列;
根据所述目标控制序列控制所述目标车辆按照所述导航行驶轨迹行驶。
2.根据权利要求1所述的方法,其中,根据所述当前环境信息确定所述目标车辆与所述障碍车辆之间进行交互的回报数据,包括:
根据所述当前环境信息构建所述目标车辆与所述障碍车辆之间进行交互的状态转移函数;
根据所述状态转移函数确定所述回报数据。
3.根据权利要求2所述的方法,其中,根据所述当前环境信息构建所述目标车辆与所述障碍车辆之间的状态转移函数,包括:
根据所述当前环境信息确定所述目标车辆在多个时刻的第一状态信息、第一控制信息以及所述障碍车辆在所述多个时刻的第二状态信息、第二控制信息;
根据所述第一状态信息、所述第一控制信息、所述第二状态信息以及所述第二控制信息确定所述目标车辆与所述障碍车辆之间的联合状态信息;
基于所述联合状态信息构建所述目标车辆与所述障碍车辆之间的状态转移函数。
4.根据权利要求3所述的方法,其中,根据所述状态转移函数确定所述回报数据,包括:
获取所述目标车辆对应的专家轨迹信息,其中,所述专家轨迹信息表征了目标对象驾驶所述目标车辆按照所述导航行驶轨迹行驶的过程中,所述目标车辆的状态信息和控制信息;
确定所述专家轨迹信息相对于预设变量的概率分布函数;
计算所述概率分布函数对应的似然函数;
根据所述似然函数的梯度值确定所述预设变量;
根据所述第一状态信息、所述第一控制信息、所述第二状态信息以及所述第二控制信息以及所述预设变量确定所述目标车辆对应的回报数据。
5.根据权利要求1所述的方法,其中,基于目标树结构及所述回报数据确定至少一个候选节点,包括:
基于所述回报数据计算所述目标树结构中每个节点所对应的平均回报值以及累计回报值;
统计所述目标树结构中每个节点的访问次数;
根据所述平均回报值、所述累计回报值以及所述访问次数从所述目标树结构的多个节点中确定所述至少一个候选节点。
6.根据权利要求5所述的方法,在基于目标树结构及所述回报数据确定至少一个候选节点之前,所述方法还包括:
对所述目标车辆的控制信息进行离散化处理,得到离散后的控制信息;
确定所述目标树结构中每个节点所对应的状态信息;
基于所述离散后的控制信息以及所述每个节点所对应的状态信息构建所述目标树结构。
7.根据权利要求5所述的方法,在基于目标树结构及所述回报数据确定至少一个候选节点之前,所述方法还包括:
根据所述当前环境信息以及所述导航行驶轨迹确定初始控制信息;
对所述初始控制信息进行离散化处理,得到离散后的控制信息;
确定所述目标树结构中每个节点所对应的状态信息;
基于所述离散后的控制信息以及所述每个节点所对应的状态信息构建所述目标树结构。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿波罗智联(北京)科技有限公司,未经阿波罗智联(北京)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310266544.1/1.html,转载请声明来源钻瓜专利网。