[发明专利]一种重型营运车辆的后向防撞驾驶决策方法有效
申请号: | 202011512719.5 | 申请日: | 2020-12-20 |
公开(公告)号: | CN112633474B | 公开(公告)日: | 2022-04-05 |
发明(设计)人: | 李旭;胡玮明;胡锦超;祝雪芬 | 申请(专利权)人: | 东南大学 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G07C5/08;B60W30/08 |
代理公司: | 南京众联专利代理有限公司 32206 | 代理人: | 许小莉 |
地址: | 210096 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 重型 营运 车辆 驾驶 决策 方法 | ||
1.一种重型营运车辆的后向防撞驾驶决策方法,其特征在于:该方法包括如下步骤:
步骤一:建立虚拟交通环境模型:面向高等级公路,建立虚拟交通环境模型,即包含直道和弯道的三车道虚拟环境模型;重型营运车辆在交通环境模型中运动,目标车辆跟随重型营运车辆进行运动,期间包括加速、减速、匀速、变道4种不同的行驶工况;
所述建立虚拟交通环境模型的过程中通过安装在每辆车上的厘米级高精度差分GPS、惯性测量单元和毫米波雷达,实时地获取车辆运动状态信息,包括:两车的位置、速度、加速度、相对间距、相对速度;通过安装在车辆尾部的视觉传感器,实时地获取目标车辆的类型;通过CAN总线读取驾驶员操控信息,包括:车辆的节气门开度、方向盘转角;
所述目标车辆是指位于重型营运车辆行驶道路后方,且位于同一车道线内、行驶方向相同、距离最近的车辆,包含小型、中型和大型车辆3种类型;
步骤二:建立后向碰撞危险评估模型;具体包括:
首先,计算重型营运车辆与目标车辆发生碰撞所需的时间:
式(1)中,RTTC(t)表示t时刻的后向距离碰撞时间,单位为秒,xc(t)为车间距离,单位为米,vF(t),vR(t)分别表示重型营运车辆和目标车辆的速度,vr(t)为两车的相对速度,单位均为米每秒,且vr(t)=vF(t)-vR(t);
其次,计算后向碰撞危险程度;当后向距离碰撞时间不小于2.1秒,且不大于4.4秒时发出后向碰撞报警,表示后向碰撞预警系统测试通过;基于此,对后向碰撞危险程度进行量化:
式(2)中,δw为后向碰撞危险的量化值;当δw≥1时,表示无后向碰撞危险;当0.5≤δw≤1时,表示存在后向碰撞危险;当0≤δw≤0.5时,表示后向碰撞危险程度非常高;
步骤三:建立重型营运车辆的后向防撞驾驶决策模型:综合考虑交通环境、车辆运行状态、后方车辆类型、后向碰撞危险程度对后向碰撞的影响,建立重型营运车辆的后向防撞驾驶决策模型,采用PPO算法建立后向防撞驾驶决策模型,通过与目标车辆运动随机过程模型进行交互式迭代学习,得到后向防撞的最优决策,具体包括以下4个子步骤:
子步骤1:定义后向防撞驾驶决策模型的基础参数
首先,将后向防撞驾驶决策问题描述为一定奖励函数下的马尔科夫决策过程(S,A,P,r),其中,S为状态空间,A为后向防撞动作决策,P表示由于目标车辆运动不确定性而导致的状态转移概率,r为奖励函数;其次,对马尔科夫决策过程的基础参数进行定义,具体地:
(1)定义状态空间
利用步骤一输出的车辆运动状态信息和步骤二输出的后向碰撞危险程度,建立状态空间表达:
St=(vF_lon,aF_lon,vr_lon,ar_lon,θstr,pthr,Lr,δw,Tm) (3)
式(3)中,St为t时刻的状态空间,vF_lon,vr_lon分别表示重型营运车辆的纵向速度和两车的相对纵向速度,单位为米每秒,aF_lon,ar_lon分别表示重型营运车辆的纵向加速度和两车的相对纵向加速度,单位为米每二次方秒,θstr为车辆的方向盘转角,单位为度,pthr为节气门开度,单位为百分数,Lr为相对车间距,单位为米,δw,Tm分别表示后向碰撞危险程度和目标车辆类型,m=1,2,3分别表示目标车辆为大型车辆、中型车辆和小型车辆,在本发明中,取Tm=m;
(2)定义动作决策
为了综合考虑横向运动和纵向运动对后向碰撞的影响,本发明将方向盘转角和节气门开度作为控制量,定义决策模型输出的驾驶策略,即动作决策:
At=[θstr_out,pthr_out] (4)
式(4)中,At为t时刻的动作决策,θstr_out表示归一化后的方向盘转角控制量,范围为[-1,1],pthr_out表示归一化后的节气门开度控制量,范围为[0,1];当pthr_out=0时,表示车辆未进行加速,当δbrake=1时,表示车辆以最大加速度进行加速;
(3)建立奖励函数
为了评价动作决策的优劣程度,通过建立回报函数的方式,将评价具体化和数值化;考虑到后向防撞驾驶决策是一个涉及安全性、舒适性目标在内的多目标优化问题,本发明将奖励函数设计为:
rt=r1+r2+r3 (5)
式(5)中,rt为t时刻的奖励函数,r1为安全距离奖励函数,r2为舒适性奖励函数,r3为惩罚函数;
首先,设计安全距离奖励函数r1:
式(6)中,Lr,Ls分别表示相对车间距和安全距离阈值,ωd为安全距离权重系数,在本发明中,取ωd=0.85;
其次,设计舒适性奖励函数r2:
r2=ωj|aF_lon(t+1)-aF_lon(t)|(7)
式(7)中,ωj为舒适性权重系数,在本发明中,取ωj=0.95;
最后,设计惩罚函数r3:
(4)设计期望最大的策略
式(9)中,π*为期望最大的策略,π为后向防撞决策策略,γ为折扣因子,且γ∈(0,1),τ(π)表示在策略π下的轨迹分布;
子步骤2:设计后向防撞驾驶决策模型的网络架构
利用“Actor-Critic”网络框架搭建后向防撞驾驶决策网络,包括Actor网络和Critic网络两部分;其中,Actor网络将状态空间信息作为输入,输出动作决策,即重型营运车辆的节气门开度和方向盘转角控制量;Critic网络将状态空间信息和动作决策作为输入,输出当前“状态-动作”的价值;具体地:
(1)设计Actor网络
建立分层级编码器结构,分别对状态空间中的各类信息进行特征提取;首先,构建3个串行连接的卷积层CF1,CF2,CF3和1个最大池化层P1,对车辆的运动状态信息进行特征提取,并将其编码为中间特征向量h1;利用相同的结构,即3个串行连接的卷积层CR1,CR2,CR3和1个最大池化层P2,对前后两车的相对运动状态信息进行特征提取,并将其编码为中间特征向量h2;利用卷积层CW1和最大池化层P3对碰撞危险程度和目标车辆类型进行特征提取,并将其编码为中间特征向量h3;其次,将特征h1,h2,h3结合并连接全连接层FC4和FC5,输出动作决策;
其中,设置卷积层CF1,CF2,CF3,CR1,CR2,CR3,CW1的神经元数量分别为20,20,10,20,20,10,20,设置全连接层FC4,FC5的神经元数量为200;各卷积层和全连接层的激活函数均为线性整流单元,其表达式为f(x)=max(0,x);
(2)设计Critic网络
利用多个隐藏层结构的神经网络建立Critic网络;首先,将状态空间St输入到隐藏层FCC1中;同时,将动作决策At输入到隐藏层FCC2中;其次,隐藏层FCC1和FCC2通过张量相加的方式进行合并;最后,依次通过全连接层FCC3和FCC4后,输出Critic网络的值;
其中,设置FCC1层和FCC2层的神经元数量为400,其余隐藏层的神经元数量均为200,各层的激活函数均为ReLU;
子步骤3:训练后向防撞驾驶决策模型
利用损失函数Jactor和Jcritic对网络参数进行梯度更新,具体训练过程如下:
子步骤3.1:初始化Actor网络和Critic网络;
子步骤3.2:进行迭代求解,每一次迭代包括子步骤3.21至子步骤3.4,具体地:
子步骤3.21:进行迭代求解,每一次迭代包括子步骤3.211至3.213,具体地:
子步骤3.211:利用步骤一的虚拟交通环境模型得到车辆的运动控制操作;
子步骤3.212:利用Actor网络得到样本数据(St,At,rt);
子步骤3.213:结束循环,得到样本点集[(S1,A1,r1),(S2,A2,r2),...,(St,At,rt)];
子步骤3.22:计算优势函数;
式(10)中,为优势函数,V(St)表示状态St的值函数;表示应该增加采取当前动作的可能性,表示应该减小采取该动作的可能性;
子步骤3.23:进行迭代求解,每一次迭代包括子步骤3.231至3.233,具体地:
子步骤3.231:计算Actor网络的目标函数;
子步骤3.232:更新Actor网络参数Jactor:
式(11)中,pt(θ)表示在策略更新过程中新策略πθ与旧策略πθ_old在动作决策分布上的比值,且clip(·)表示裁剪函数,ε为常数,在本发明中,取ε=0.25;
子步骤3.233:更新Critic网络参数Jcritic:
子步骤3.234:结束循环;
子步骤3.3:按照子步骤3.2提供的方法进行迭代更新,使Actor网络和Critic网络逐步收敛;在训练过程中,若车辆发生后向碰撞或侧翻,则终止当前回合并开始新的回合进行训练;当迭代达到最大步数或模型能够稳定准确地进行后向防撞驾驶决策时,训练结束;
子步骤4:利用后向防撞决策模型输出决策策略
将厘米级高精度差分GPS、惯性测量单元、毫米波雷达、CAN总线获取的信息输入到已训练的后向防撞驾驶决策模型中,可以定量输出合理的方向盘转角和节气门开度控制量,为驾驶员提供有效、可靠的后向防撞驾驶建议,从而实现了有效、可靠、具有自适应性的重型营运车辆后向防撞驾驶决策。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南大学,未经东南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011512719.5/1.html,转载请声明来源钻瓜专利网。