[发明专利]一种基于双层深度强化学习的自动驾驶车辆换道方法在审

专利信息
申请号: 202310347395.1 申请日: 2023-04-03
公开(公告)号: CN116639124A 公开(公告)日: 2023-08-25
发明(设计)人: 彭剑坤;申阳;张思雨;范毅;周稼铭;衣丰艳 申请(专利权)人: 东南大学
主分类号: B60W30/18 分类号: B60W30/18;B60W60/00;G06N3/04;G06N3/08
代理公司: 南京经纬专利商标代理有限公司 32200 代理人: 朱小兵
地址: 210096*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 双层 深度 强化 学习 自动 驾驶 车辆 方法
【权利要求书】:

1.一种基于双层深度强化学习的自动驾驶车辆换道方法,所述换道包括换道决策和换道运动两个阶段,其特征在于,该换道方法包括以下步骤:

步骤一、构建DQN进行自动驾驶汽车换道决策离散动作的学习;

步骤二、构建DDPG进行自动驾驶汽车运动轨迹连续动作的学习;

步骤三、以步骤二的DQN、步骤三的DDPG构建双层深度强化学习网络,使DQN输出动作转变成DDPG的开启信息;

步骤四、对双层深度强化学习网络进行训练,并基于训练完成的双层深度强化学习网络进行自动驾驶车辆换道。

2.如权利要求1所述的基于双层深度强化学习的自动驾驶车辆换道方法,其特征在于:

步骤一具体为:以目标车辆接收到的环境信息作为目标车辆的状态空间,由DQN选择动作执行,之后更新目标车辆的状态空间,并选取换道完成前后关于目标车辆与前车的距离差值的函数作为奖励函数。

3.如权利要求2所述的基于双层深度强化学习的自动驾驶车辆换道方法,其特征在于:所述环境信息包括:

目标车辆速度、位置、当前车道编号;当前车道前车速度、位置;相邻车道前车速度、位置。

4.如权利要求2所述的基于双层深度强化学习的自动驾驶车辆换道方法,其特征在于:根据目标车辆当前所在车道编号,动作选择包括以下三种情况:

1)目标车辆当前位于中间车道时,有三个动作选择:保持当前车道、更换左侧车道、更换右侧车道;

2)目标车辆当前位于最左侧车道时,有两个动作选择:保持当前车道、更换右侧车道;

3)目标车辆当前位于最右侧车道时,有两个动作选择:保持当前车道、更换左侧车道。

5.如权利要求1所述的基于双层深度强化学习的自动驾驶车辆换道方法,其特征在于:步骤二具体为:以目标车辆接收到的环境信息作为目标车辆的状态空间,由DDPG网络选择动作执行,之后更新目标车辆的状态空间,并选取状态空间更新前后关于目标车辆与前车的距离、目标车辆横向加速度、目标车辆速度的函数作为奖励函数。

6.如权利要求5所述的基于双层深度强化学习的自动驾驶车辆换道方法,其特征在于:环境信息包括:

目标车辆速度、角度、位置;当前车道前车速度、位置;目标车道前车速度、位置信息以及所接收的DQN动作。

7.如权利要求5所述的基于双层深度强化学习的自动驾驶车辆换道方法,其特征在于:动作选择为目标车辆与道路的角度。

8.如权利要求1所述的基于双层深度强化学习的自动驾驶车辆换道方法,其特征在于:

步骤四中DQN的损失函数为:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南大学,未经东南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202310347395.1/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top