[发明专利]一种驾驶决策方法及装置在审
申请号: | 202010584738.2 | 申请日: | 2020-06-23 |
公开(公告)号: | CN113837211A | 公开(公告)日: | 2021-12-24 |
发明(设计)人: | 李栋;王滨;刘武龙;庄雨铮 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G05D1/02;G05D1/00 |
代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 张翠华 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 驾驶 决策 方法 装置 | ||
本申请涉及自动驾驶领域,公开了一种驾驶决策方法及装置,用以提高驾驶决策策略的鲁棒性,保障输出的决策结果最优。该方法包括:基于当前驾驶环境状态构建蒙特卡洛树,所述蒙特卡洛树包括根节点和N‑1个非根节点,每个节点表示一个驾驶环境状态,其中根节点表示所述当前驾驶环境状态,任一非根节点表示的驾驶环境状态,通过驾驶环境随机模型基于所述非根节点的父节点表示的驾驶环境状态,以及所述非根节点的父节点扩展所述非根节点的驾驶动作预测得到;根据蒙特卡洛树中每个节点的访问次数和/或值函数,在蒙特卡洛树中确定一个从所述根节点开始至叶子节点结束的节点序列;根据所述节点序列中各个节点所对应的驾驶动作,确定驾驶动作序列。
技术领域
本申请实施例涉及自动驾驶领域,尤其涉及一种驾驶决策方法及装置。
背景技术
随着自动驾驶时代的到来,具有自动驾驶功能的智能车辆成为各大厂商研究的重点。目前,自动驾驶包括辅助驾驶和完全自动驾驶,其实现的关键技术有:环境感知、驾驶决策以及控制执行等。其中,驾驶决策根据感知到的交通参与者信息,给出驾驶动作,供车辆执行。
目前,驾驶决策通常是基于强化学习(deep Q network,DQN)算法实现的,通过DQN算法构建的DQN模型,对大量车辆在某一时刻的驾驶环境状态(如自身车辆速度、相邻车辆速度等),以及车辆驾驶者基于该时刻的驾驶环境状态输出的驾驶动作(如向左变道、向右变道等)进行学习。在驾驶决策时,即可根据车辆当前的驾驶环境状态,通过DQN模型,得到自动驾驶车辆需要执行的驾驶动作。
然而,基于DQN模型的驾驶决策,在输出驾驶动作时,未考虑到输出的驾驶动作对车辆后续驾驶的影响,难以保证输出的决策结果最优。
发明内容
本申请实施例提供一种驾驶决策方法及装置,用以提高驾驶决策策略的鲁棒性,保障输出的决策结果最优。
第一方面,本申请实施例提供了一种驾驶决策方法,该方法包括:基于当前驾驶环境状态构建蒙特卡洛树,其中所述蒙特卡洛树包含N个节点,每个节点表示一个驾驶环境状态,所述N个节点包括根节点和N-1个非根节点,其中所述根节点表示所述当前驾驶环境状态,第一节点表示的驾驶环境状态,通过驾驶环境随机模型基于所述第一节点的父节点表示的驾驶环境状态,以及第一驾驶动作预测得到,其中,所述第一驾驶动作为所述第一节点的父节点在扩展所述第一节点的过程中确定的驾驶动作(也即所述第一驾驶动作为所述第一节点的父节点扩展所述第一节点的驾驶动作),所述第一节点为所述N-1个非根节点中的任意一个节点,所述N为大于或等于2的正整数;根据所述蒙特卡洛树中每个节点的访问次数和/或值函数,在所述蒙特卡洛树中确定一个从所述根节点开始至叶子节点结束的节点序列;根据所述节点序列中包含的各个节点所对应的驾驶动作,确定驾驶动作序列,所述驾驶动作序列用于驾驶决策;其中,所述每个节点的访问次数,根据所述节点的子节点的访问次数以及所述节点的初始访问次数确定,所述每个节点的值函数,根据所述节点的子节点的值函数和所述节点的初始值函数确定,其中,所述每个节点的初始访问次数为1、初始值函数根据与所述节点表示的驾驶环境状态匹配的值函数确定。
采用上述方法,通过驾驶环境随机模型,可以预测自动驾驶车辆在未来一段时间内多步驾驶动作可能面临的各种驾驶环境状态,构建蒙特卡洛树,并基于自动驾驶车辆在未来一段时间内多步驾驶动作可能面临的各种驾驶环境状态,确定最有利于车辆行驶的驾驶动作序列,提高了驾驶决策策略的鲁棒性,有利于保障输出的决策结果最优。
在一个可能的设计中,通过所述驾驶环境随机模型基于所述第一节点的父节点表示的驾驶环境状态,以及所述第一驾驶动作,预测得到所述第一节点表示的驾驶环境状态,包括:通过所述驾驶环境随机模型采用Dropout前向传播,预测基于所述第一节点的父节点表示的驾驶环境状态,执行所述第一驾驶动作后的驾驶环境状态的概率分布;从所述概率分布采样得到所述第一节点表示的驾驶环境状态。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010584738.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:半导体结构及其形成方法
- 下一篇:高尔夫球杆头清洗方法