[发明专利]一种基于双层深度强化学习的自动驾驶车辆换道方法在审
申请号: | 202310347395.1 | 申请日: | 2023-04-03 |
公开(公告)号: | CN116639124A | 公开(公告)日: | 2023-08-25 |
发明(设计)人: | 彭剑坤;申阳;张思雨;范毅;周稼铭;衣丰艳 | 申请(专利权)人: | 东南大学 |
主分类号: | B60W30/18 | 分类号: | B60W30/18;B60W60/00;G06N3/04;G06N3/08 |
代理公司: | 南京经纬专利商标代理有限公司 32200 | 代理人: | 朱小兵 |
地址: | 210096*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 双层 深度 强化 学习 自动 驾驶 车辆 方法 | ||
1.一种基于双层深度强化学习的自动驾驶车辆换道方法,所述换道包括换道决策和换道运动两个阶段,其特征在于,该换道方法包括以下步骤:
步骤一、构建DQN进行自动驾驶汽车换道决策离散动作的学习;
步骤二、构建DDPG进行自动驾驶汽车运动轨迹连续动作的学习;
步骤三、以步骤二的DQN、步骤三的DDPG构建双层深度强化学习网络,使DQN输出动作转变成DDPG的开启信息;
步骤四、对双层深度强化学习网络进行训练,并基于训练完成的双层深度强化学习网络进行自动驾驶车辆换道。
2.如权利要求1所述的基于双层深度强化学习的自动驾驶车辆换道方法,其特征在于:
步骤一具体为:以目标车辆接收到的环境信息作为目标车辆的状态空间,由DQN选择动作执行,之后更新目标车辆的状态空间,并选取换道完成前后关于目标车辆与前车的距离差值的函数作为奖励函数。
3.如权利要求2所述的基于双层深度强化学习的自动驾驶车辆换道方法,其特征在于:所述环境信息包括:
目标车辆速度、位置、当前车道编号;当前车道前车速度、位置;相邻车道前车速度、位置。
4.如权利要求2所述的基于双层深度强化学习的自动驾驶车辆换道方法,其特征在于:根据目标车辆当前所在车道编号,动作选择包括以下三种情况:
1)目标车辆当前位于中间车道时,有三个动作选择:保持当前车道、更换左侧车道、更换右侧车道;
2)目标车辆当前位于最左侧车道时,有两个动作选择:保持当前车道、更换右侧车道;
3)目标车辆当前位于最右侧车道时,有两个动作选择:保持当前车道、更换左侧车道。
5.如权利要求1所述的基于双层深度强化学习的自动驾驶车辆换道方法,其特征在于:步骤二具体为:以目标车辆接收到的环境信息作为目标车辆的状态空间,由DDPG网络选择动作执行,之后更新目标车辆的状态空间,并选取状态空间更新前后关于目标车辆与前车的距离、目标车辆横向加速度、目标车辆速度的函数作为奖励函数。
6.如权利要求5所述的基于双层深度强化学习的自动驾驶车辆换道方法,其特征在于:环境信息包括:
目标车辆速度、角度、位置;当前车道前车速度、位置;目标车道前车速度、位置信息以及所接收的DQN动作。
7.如权利要求5所述的基于双层深度强化学习的自动驾驶车辆换道方法,其特征在于:动作选择为目标车辆与道路的角度。
8.如权利要求1所述的基于双层深度强化学习的自动驾驶车辆换道方法,其特征在于:
步骤四中DQN的损失函数为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南大学,未经东南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310347395.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种适用于大范围重离子束流的测量监督装置
- 下一篇:高精械架机械手及工作方法