[发明专利]一种基于强化学习的结构化道路无人驾驶决策规划方法有效
申请号: | 202010249138.0 | 申请日: | 2020-04-01 |
公开(公告)号: | CN111473794B | 公开(公告)日: | 2022-02-11 |
发明(设计)人: | 宋文杰;封志奇;付梦印;陈思园;张婷;杨毅 | 申请(专利权)人: | 北京理工大学 |
主分类号: | G01C21/34 | 分类号: | G01C21/34;G06N3/04;G06N3/08;G06Q10/04 |
代理公司: | 北京理工大学专利中心 11120 | 代理人: | 田亚琪 |
地址: | 100081 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 强化 学习 结构 道路 无人驾驶 决策 规划 方法 | ||
1.一种基于强化学习的结构化道路无人驾驶决策规划方法,其特征在于,包括以下步骤:
步骤一、选取主车前方a米的距离范围构建局部地图,在局部地图中根据实际道路情况划分车道信息,并标注主车位置(sego,dego)及其他车辆的位置信息(si,di),i=1,2,...,n;
步骤二、随着主车的运动获得多帧局部地图,将所述多帧局部地图作为训练后的DQN网络的输入,输出面对当前场景主车采取的决策策略并获得目标车道,决策策略为:车道保持、向左换道或向右换道;
其中,DQN网络在训练过程中,通过奖励函数获得DQN网络的奖励值,用于Target-Q网络的更新;
所述奖励函数为:
c1,c2为reward权重,k(t)为轨迹的曲率;t为训练时间,v为当前车速,vTarget为目标车速;
步骤三、在目标车道进行采样,对每个采样点进行一次轨迹规划,采用分段贝塞尔曲线表征根据采样点所规划的轨迹,并计算每条轨迹的代价,选取代价最小的轨迹作为主车执行的轨迹。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京理工大学,未经北京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010249138.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于联盟区块链的档案管理方法及装置
- 下一篇:贴膜装置