[发明专利]城市环境下智能驾驶车辆环境自适应汇入方法有效
申请号: | 201810780413.4 | 申请日: | 2018-07-17 |
公开(公告)号: | CN109143852B | 公开(公告)日: | 2020-09-18 |
发明(设计)人: | 陈雪梅;刘哥盟;杜明明 | 申请(专利权)人: | 北京理工大学 |
主分类号: | G05B13/04 | 分类号: | G05B13/04 |
代理公司: | 常州佰业腾飞专利代理事务所(普通合伙) 32231 | 代理人: | 滕诣迪 |
地址: | 100081 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 城市环境 智能 驾驶 车辆 环境 自适应 汇入 方法 | ||
1.一种城市环境下智能驾驶车辆环境自适应汇入方法,其特征在于包括如下步骤:
提取初始状态向量;
根据贪心策略计算动作变量,执行汇入动作的同时更新汇入场景,动作变量如果采取随机动作,则以均匀概率选取汇入间隙和汇入动作,
如果采用智能选取动作,候选间隙包括前车、后随车与汇入车辆,比较所有候选间隙的最大动作值函数,选择其中最大值函数,从中挑选最大值对应的间隙和动作,返回目标汇入间隙和智能汇入动作;
感知下一时刻的状态向量;
根据环境反馈信息计算奖励值;
将初始状态向量、动作变量、下一时刻的状态向量、奖励值存入样本集,达到足够样本后根据采用LSPI算法汇入策略建模进行评估和改进;
重复执行上述步骤直至汇入成功;
LSPI算法汇入策略建模:
(1)状态空间
LSPI算法的单元系统状态空间描述为七维的向量空间(x0,y0,v0,x1,v1,x2,v2),其中,(x0,y0,v0)为汇入车辆的位置坐标和速度信息,(x1,v1,x2,v2)表示目标车道前车和后随车在仿真的过程中纵向位置坐标以及速度信息;
(2)基函数确立
将单元系统中两车辆的碰撞时间TTC、车头时距gti、相对距离dxi和相对速度dvi以及无人驾驶车辆一部分自身状态信息(y0,v0)纳入基函数,该基函数包含14维;
(3)动作空间
将纵向的加速度离散为急减速,减速,匀速,加速,急加速五个动作值,分别对应(-4,-2,0,2,4);
(4)奖励函数
将限速和舒适性纳入评价指标,建立线性加权的综合奖励值模型,如公式(1)所示,
Rsafety(s,a)表示安全性奖励值,μ1为安全性奖励值权重,Rtask(s,a)表示任务成功或失败的奖励值,μ2为任务成功奖励值权重,Rtime(s,a)表示汇入效率奖励值,μ3为汇入效率奖励值权重,Rrule(s,a)表示限速奖励值,μ4为汇入效率奖励值权重,Rcomfort(s,a)舒适性奖励值,μ5为汇入效率奖励值权重。
2.根据权利要求1所述的城市环境下智能驾驶车辆环境自适应汇入方法,其特征在于:状态空间描述为七维的向量空间,其中,前三维为汇入车辆的位置坐标和速度信息,后四维为目标车道前车和后随车在仿真的过程中纵向位置坐标以及速度信息。
3.根据权利要求1所述的城市环境下智能驾驶车辆环境自适应汇入方法,其特征在于:所述的初始状态空间采用的基函数采用两车辆的碰撞时间、车头时距、相对距离和相对速度以及运动状态纳入基函数。
4.根据权利要求1所述的城市环境下智能驾驶车辆环境自适应汇入方法,其特征在于:所述的动作变量包括纵向速度决策变量和横向速度决策变量。
5.根据权利要求4所述的城市环境下智能驾驶车辆环境自适应汇入方法,其特征在于:所述的动作变量中的纵向速度决策变量的加速度离散为急减速,减速,匀速,加速,急加速五个动作值,横向速度决策变量为两个动作值,则纵向速度决策变量和横向速度决策变量的动作空间为10个动作。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京理工大学,未经北京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810780413.4/1.html,转载请声明来源钻瓜专利网。