[发明专利]一种面向跨海大桥路况的自动驾驶决策方法有效
申请号: | 202110641322.4 | 申请日: | 2021-06-09 |
公开(公告)号: | CN113386790B | 公开(公告)日: | 2022-07-12 |
发明(设计)人: | 唐晓峰 | 申请(专利权)人: | 扬州大学 |
主分类号: | B60W60/00 | 分类号: | B60W60/00;B60W40/04;B60W40/06;B60W40/10;G06N3/04;G06N3/08 |
代理公司: | 南京纵横知识产权代理有限公司 32224 | 代理人: | 张赏 |
地址: | 225009 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 面向 跨海大桥 路况 自动 驾驶 决策 方法 | ||
1.一种面向跨海大桥路况的自动驾驶决策方法,其特征在于,包括:
获取当前车辆通过跨海大桥的环境状态信息,基于预先训练的自动驾驶模型确定当前的车辆动作;
所述自动驾驶模型包括元学习网络、Actor网络和Critic网络,所述自动驾驶模型基于以下步骤训练获得:
获取车辆通过跨海大桥的环境状态信息;
基于元学习网络确定Actor网络和Critic网络的网络参数;
将环境状态信息输入Actor网络,得到Actor网络基于决策策略的决策车辆动作;
根据预定奖励函数,获取对于决策策略的奖励;
Critic网络根据环境状态信息和决策车辆动作,对所述决策策略进行评价;
Actor网络根据所述评价的结果,更新所述决策策略;
Critic网络根据所述奖励,更新对所述决策策略进行评价的评价策略;
其中,所述预定奖励函数为:
其中,为轨迹误差奖励,为轨迹误差变化率奖励,为航向角度误差奖励,为航向角度误差变化率奖励,和分别为车辆与参考轨迹的侧滑移角差和变化率奖励,rδ为方向盘转角奖励,eΘ和分别为车辆侧倾误差和侧倾误差变化率,分别为其下标参数的权重,K为方向盘转角权重,y是实际轨迹,yr是标准轨迹;θ是实际侧倾角度,θref是参考侧倾角度。
2.根据权利要求1的方法,其特征在于,所述环境状态信息包括:道路周围交通状态、车辆状态、车辆周围障碍物状态信息、车辆与道路环境状态、路面的滑移率、附着系数、桥面振动角度中的一种或多种。
3.根据权利要求1的方法,其特征在于,所述车辆动作的动作空间包括转向角、油门和制动动作中的一种或多种。
4.根据权利要求1的方法,其特征在于,获取车辆通过跨海大桥的环境状态信息,包括,通过经验回放获取车辆通过跨海大桥的环境状态信息。
5.根据权利要求1所述的方法,其特征在于,所述Critic网络包括值网络和3个Q网络,
所述对所述决策策略进行评价,包括,根据所述值网络和3个Q网络的输出值,分别获取3个Q值,根据3个Q值中的最低值,确定对所述决策策略进行评价的评价结果。
6.根据权利要求1所述的方法,其特征在于,所述Actor网络包括输入层、隐藏层、输出层,Actor网络输出的决策车辆动作为由转向角和油门动作组成的矢量,分别对应Actor网络输出层的2个输出神经元,其中,对应油门动作的输出神经元的激活函数是Sigmoid函数,对应转向角动作的神经元的激活函数为Tanh函数;所述隐藏层包括三层子隐藏层,其中,第一子隐藏层包括200个神经元,第二子隐藏层包括400个神经元,第三子隐藏层包括采用200个神经元,隐藏层神经元的激活函数为ReLu函数。
7.根据权利要求1所述的方法,其特征在于,所述基于元学习网络确定Actor网络和Critic网络的网络参数,包括,基于元学习网络确定多个任务下的Actor网络和Critic网络的网络参数;
所述将环境状态信息输入Actor网络,得到决策车辆动作,包括,将环境状态信息输入Actor网络,得到多个任务下的决策车辆动作。
8.根据权利要求7所述的方法,其特征在于,所述多个任务包括,车道保持、换道、巡航行驶、超车中的一种或多种。
9.根据权利要求1所述的方法,其特征在于,通过跨海大桥的车辆为多辆,所述方法还包括;
将所述多个车辆分别设定为移动边缘计算节点,在所述多个车辆中分别架构元学习模型、actor网络和critic网络,通过车车通信技术进行各元学习模型、actor网络和critic网络中的参数共享,并基于共享的参数,进行各元学习模型、actor网络和critic网络的训练。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于扬州大学,未经扬州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110641322.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种证卡制作设备
- 下一篇:白酒酿造蒸馏过程中在线酒度检测分级的方法及装置