[发明专利]一种基于分层滚动优化的自动驾驶多任务协调决策方法在审
申请号: | 202310400191.X | 申请日: | 2023-04-14 |
公开(公告)号: | CN116552563A | 公开(公告)日: | 2023-08-08 |
发明(设计)人: | 林歆悠;陈千炼;张彪;黄强;叶锦泽 | 申请(专利权)人: | 福州大学 |
主分类号: | B60W60/00 | 分类号: | B60W60/00;B60W30/09;B60W30/095;B60W50/00 |
代理公司: | 福州元创专利商标代理有限公司 35100 | 代理人: | 张灯灿;蔡学俊 |
地址: | 350108 福建省福州市*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 分层 滚动 优化 自动 驾驶 任务 协调 决策 方法 | ||
1.一种基于分层滚动优化的自动驾驶多任务协调决策方法,其特征在于,利用自动驾驶车辆环境状态信息作为强化学习决策框架的输入,将驾驶目标规划为多个驾驶任务的衔接,以实现多任务间的协调;将各个驾驶任务分别具体化为控制动作,但仅执行第一个驾驶任务的控制动作;然后滚动向前进入下一时间步,基于更新的自动驾驶车辆环境状态信息再次进行规划和控制动作的执行;如此反复进行规划,实现滚动优化决策。
2.根据权利要求1所述的一种基于分层滚动优化的自动驾驶多任务协调决策方法,其特征在于,包括以下步骤:
步骤S1、利用视觉传感器获得自动驾驶车辆周围的原始图像,对图像进行处理并获取其中的周围车辆和障碍物信息;将周围车辆和障碍物信息与本车信息、地图信息构成自动驾驶车辆环境状态信息并表示成高维环境状态鸟瞰图;将高维环境状态鸟瞰图输入神经网络框架,提取环境状态信息的低维表示,得到低维环境状态信息,以简化强化学习决策框架的输入信息;
步骤S2、将低维环境状态信息输入强化学习决策框架,通过强化学习决策框架进行多任务决策,得到决策动作,即多个驾驶任务的组合串行;在此基础上,决策各个驾驶任务的控制动作序列,即控制动作的组合串行;控制动作由动作单元库中的动作单元组成;
步骤S3、当决策动作和控制动作序列被规划之后,仅执行第一个驾驶任务对应的动作单元序列;
步骤S4、滚动向前进入下一时间步,重复步骤S1-S3,更新自动驾驶车辆环境状态信息,并基于此再次进行决策和决策更新后第一个驾驶任务的动作单元序列的执行;如此反复进行规划,实现滚动优化决策。
3.根据权利要求2所述的一种基于分层滚动优化的自动驾驶多任务协调决策方法,其特征在于,所述本车信息包括本车位置和状态信息;所述地图信息来源于已有高精地图或者识别模块获得的语义地图,包含道路路径信息;所述道路路径信息为全局的路径信息,包含从起点到终点的系列路径点,在鸟瞰图中以折线表示;所述高维环境状态鸟瞰图为256*256像素,被处理调整为64*64像素,并且视角始终与本车视图对齐,本车位于视图的固定位置。
4.根据权利要求2所述的一种基于分层滚动优化的自动驾驶多任务协调决策方法,其特征在于,为了将车辆的行为建模并作为强化学习决策框架的输入,把本车和周围车辆的尺寸建模为具有碰撞风险的可变单元,根据车辆的驾驶行为动态改变。
5.根据权利要求4所述的一种基于分层滚动优化的自动驾驶多任务协调决策方法,其特征在于,将车辆尺寸建模为可变单元,具体如下:
对于恒速行驶车辆,其前后尺寸分别定义为:
其中,Lhead为可变单元基于车辆原始尺寸前方延长的尺寸,Lttc为可变单元基于车辆原始尺寸后方延长的尺寸,ΔT为与前车保持最小间距所需的时间常数,VHV为本车车速,Vfront为前车车速,Vrear为后车车速;
对于正在加速车辆和减速车辆,分别将该车辆前方、后方尺寸增加;定义如下:
其中,Δt表示图像采集间隔,Δv表示相对速度;
对于静止障碍物,将其尺寸向后延长至安全刹车距离;
对于变道车辆,将其变道方向的尺寸延长,延长尺寸以车道尺寸为准;
对于大型车辆,固定延长其前后尺寸,其中后方尺寸相对于前方尺寸延长更多;
所述可变单元用于判定事故发生,如果两车的可变单元重合,则判定两车事故。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于福州大学,未经福州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310400191.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种清除蜂王浆中残留农药的装置及方法
- 下一篇:核电站隧洞清理机器人