[发明专利]基于行车风险分析的车辆强化学习运动规划方法在审
申请号: | 202210336477.1 | 申请日: | 2022-03-31 |
公开(公告)号: | CN114779764A | 公开(公告)日: | 2022-07-22 |
发明(设计)人: | 周彬;廖亚萍;余贵珍;倪浩原;张传莹 | 申请(专利权)人: | 北京航空航天大学 |
主分类号: | G05D1/02 | 分类号: | G05D1/02 |
代理公司: | 北京天汇航智知识产权代理事务所(普通合伙) 11987 | 代理人: | 黄川 |
地址: | 100191*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 行车 风险 分析 车辆 强化 学习 运动 规划 方法 | ||
1.一种基于行车风险分析的车辆强化学习运动规划方法,其特征在于包括如下步骤:
步骤1:利用视觉传感器获取本车所在车道的两侧边界信息该由车道两侧边界点横纵坐标(Xr,Xl)以及本车到左右两侧边界的垂直距离(dl,dr)组成,即利用高精度地图、激光雷达和毫米波雷达获取状态信息数组由本车坐标位置(X,Y)、周围环境障碍物的坐标位置(Xobs,Yobs)和相对速度Δv组成,即所述距离Δv=[Δv1,Δv2,…,Δvn],其中n是激光雷达和毫米波雷达在可检测范围内检测到的障碍物数量;
步骤2:将车道边界信息和相对状态信息组合成状态向量相对状态信息并输入基于深度强化学习的车辆运动规划模型Φ中,以输出本车动作向量action,即action=[a,θ],其中a∈[-amax,amax]是加速度动作,amax表示最大加速度,θ∈[-θmax,θmax]是方向盘转角动作,当θ∈[0,θmax]时表示方向盘向左转动θ转角,当θ∈[-θmax,0]时表示方向盘向右转动θ转角;
步骤3:本车根据步骤2获取的动作向量action行驶t时长后,判断是否到达目的地,若是,则结束工作状态,否则进入步骤1进行下一时间步长的车辆控制。
2.如权利要求1所述的基于行车风险分析的车辆强化学习运动规划方法,其特征在于,所述步骤2中所述的车辆运动规划模型Φ是通过强化学习与环境交互训练获取的,且该训练包括如下步骤:
步骤21:在深度学习环境中初始化车辆运动规划模型Φ的深度网络参数,并在车辆仿真环境中分别随机重置本车与障碍物的坐标位置和速度;其中障碍物包括行人、车辆、静止路障等,设置训练状态为done=False;获取当前时刻t的车道边界信息和车辆与障碍物的状态信息
步骤22:将车道边界信息和车辆与障碍物间的状态信息组合成状态向量并输入车辆运动规划模型Φ的深度网络中进行计算,获取当前时刻的动作向量actiont;
步骤23:基于步骤22获取的动作向量actiont预测本车与周围车辆在未来时刻t+Δt的运动状态信息所述运动状态信息与上述的组成状态变量相同;然后针对运动状态信息计算获取相应的行车风险值
步骤24:若其中GCollision指碰撞风险阈值,则将步骤2输出的动作actiont确定为碰撞风险动作,同时将动作向量actiont中的加速度动作at更换为最小加速度amin;若其中Gdangerous为危险风险阈值,则将动作actiont确定为危险风险动作,并按照相对运动状态对加速度动作at进行安全补偿,即将加速度动作at更改为其中为安全补偿值,ε为安全补偿系数,同样若则确定输出的动作actiont为普通风险动作,同时保持步骤2获取的动作向量actiont不变;
步骤25:本车按照步骤24输出的动作actiont行驶Δt时长后,输出t+Δt时刻的车道边界信息和相对状态信息并组合成状态向量
步骤26:同时根据中的判断本车与障碍物是否发生碰撞或者t+Δt是否满足t+Δt≥T,其中T指每回合的最大训练时长,如果是,则将训练状态更改为done=True,否则,保持done=False;
步骤27:将状态向量输入奖励函数中获取此时的奖励值同时将作为一个样本存储至经验池中;
步骤28:若经验池中的样本量大于N,则从经验池中随机筛选n个样本对模型Φ中的深度网络参数进行梯度优化;
步骤29:若done=True,则结束本回合训练,同时判断此时的训练回合数是否达到了最大回合数,如果没有,则进入步骤21开始下一回合训练,否则结束训练;若done=False,令t=t+Δt,进入步骤22开始下一步长的训练。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学,未经北京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210336477.1/1.html,转载请声明来源钻瓜专利网。