[发明专利]用于确定自动驾驶中的驾驶动作的系统和方法有效
申请号: | 201811547926.7 | 申请日: | 2018-12-18 |
公开(公告)号: | CN111413957B | 公开(公告)日: | 2021-11-02 |
发明(设计)人: | 罗威 | 申请(专利权)人: | 北京航迹科技有限公司 |
主分类号: | G05D1/02 | 分类号: | G05D1/02 |
代理公司: | 成都七星天知识产权代理有限公司 51253 | 代理人: | 杨永梅 |
地址: | 100193 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 确定 自动 驾驶 中的 动作 系统 方法 | ||
1.一种用于确定自动驾驶中驾驶动作的系统,包括:
获取模块,用于获取与车辆相关的驾驶信息;
状态确定模块,用于确定所述车辆的状态;
候选驾驶动作确定模块,用于基于所述驾驶信息和所述车辆的所述状态,通过使用训练的驾驶动作模型,确定一个或以上候选驾驶动作和对应于所述一个或以上候选驾驶动作的一个或以上评估值,在所述训练的驾驶动作模型的训练过程中,
基于初始样本驾驶动作的初始奖励值,确定与初始驾驶动作模型相关的初始样本评估值,所述初始奖励值与驾驶路径与障碍物之间的距
离、驾驶路径的平滑度和/或驾驶路径的舒适度相关;
所述初始样本评估值不满足预设条件,执行迭代更新;
基于先前迭代中对应于更新的样本驾驶动作的更新的奖励值以及样本评估值,确定与更新的驾驶动作模型相关的更新的样本评估值;
所述更新的样本评估值满足预设条件,模型训练结束;
目标驾驶动作确定模块,用于基于所述一个或以上评估值,从所述一个或以上候选驾驶动作中选择目标驾驶动作;
目标驾驶路径确定模块,用于基于据所述目标驾驶动作确定目标驾驶路径;以及
传输模块,用于将信号发送至所述车辆的控制组件,以指示所述车辆执行所述目标驾驶动作以遵循所述目标驾驶路径。
2.根据权利要求1所述的系统,其特征在于,所述与车辆相关的驾驶信息包括所述车辆第一预定范围内的感知信息和所述车辆所述第一预定范围内的地图信息。
3.根据权利要求2所述的系统,其特征在于,所述感知信息包括道路信息和障碍物信息。
4.根据权利要求1所述的系统,其特征在于,所述车辆的所述状态包括所述车辆的速度、所述车辆的加速度以及所述车辆的方向盘的角度。
5.根据权利要求1-4中任一项所述的系统,其特征在于,还包括训练模块,所述训练模块用于:
获取初始驾驶动作模型;
获取初始样本驾驶信息,所述初始样本驾驶信息包括样本车辆第二预定范围内的初始样本感知信息和所述样本车辆所述第二预定范围内的初始样本地图信息;
获取所述样本车辆的初始样本状态;
基于所述初始样本驾驶信息、所述样本车辆的所述初始样本状态以及所述初始驾驶动作模型,确定初始样本驾驶动作;
基于对应于所述初始样本驾驶动作的初始奖励值,确定与所述初始驾驶动作模型相关的初始样本评估值,其特征在于,所述初始奖励值与与所述初始样本驾驶动作相关的初始样本驾驶路径与障碍物之间的距离相关;
确定所述初始样本评估值是否满足预设条件;以及
响应于确定所述初始样本评估值满足所述预设条件,指定所述初始驾驶动作模型作为所述训练的驾驶动作模型。
6.根据权利要求5所述的系统,其特征在于,所述训练模块进一步用于:
响应于确定所述初始样本评估值不满足所述预设条件,执行一个或以上迭代以更新所述初始驾驶动作模型,直到更新的样本评估值满足所述预设条件,其特征在于,所述一个或以上迭代中的每一个包括:
基于先前迭代中的奖励值确定更新的驾驶动作模型;
获取更新的样本驾驶信息;
基于所述先前迭代中的样本驾驶动作和所述先前迭代中的所述样本车辆的样本状态,估计所述样本车辆的更新的样本状态;
基于所述更新的样本驾驶信息、所述样本车辆的所述更新的样本状态以及所述更新的驾驶动作模型,确定更新的样本驾驶动作;
基于对应于所述更新的样本驾驶动作的更新的奖励值和所述先前迭代中的样本评估值,确定与所述更新的驾驶动作模型相关的更新的样本评估值;以及
确定所述更新的样本评估值是否满足所述预设条件。
7.根据权利要求1所述的系统,其特征在于,所述训练的驾驶动作模型包括Q-学习神经网络模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航迹科技有限公司,未经北京航迹科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811547926.7/1.html,转载请声明来源钻瓜专利网。