[发明专利]一种基于强化学习的网联车辆信号灯控路口经济通行方法有效
申请号: | 202110554621.4 | 申请日: | 2021-05-20 |
公开(公告)号: | CN113269963B | 公开(公告)日: | 2021-12-10 |
发明(设计)人: | 殷国栋;丁昊楠;董昊轩 | 申请(专利权)人: | 东南大学 |
主分类号: | G08G1/01 | 分类号: | G08G1/01;G08G1/0967;G07C5/08;H04W4/02;H04W4/44;G06F30/20 |
代理公司: | 北京德崇智捷知识产权代理有限公司 11467 | 代理人: | 郝雅洁 |
地址: | 210000 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 强化 学习 车辆 信号灯 路口 经济 通行 方法 | ||
1.一种基于强化学习的网联车辆信号灯控路口经济通行方法,其特征在于,包括以下步骤:
获取车辆以及路侧环境状态信息,具体包括:
基于无线短波通讯或5G/LTE通讯与路侧设施信息交互,获取信号灯当前状态信息,结合定位系统对车辆实时精准定位;
通过车载传感器检测车辆状态信息,将所述车辆状态信息上传至车载控制单元;
搭建路口通行生态驾驶模型:包括搭建整车纵向动力学模型和搭建路侧信号灯状态交通环境模型,具体包括:
根据车辆纵向动力学分析得出纯电动汽车在行驶过程中所受到的加速阻力、坡道阻力、滚动阻力以及空气阻力,搭建所述整车纵向动力学模型:
其中,m为车辆的质量;δ为汽车旋转换算系数,v为车速;t为进入路口开始所用时间;Tp为电机驱动转矩;i0为主减速器传动比;ηT为传动效率;rd为车轮滚动半径;ρ为车辆周围空气密度;A为车辆迎风面积;CD为空气阻力系数;g为重力加速度;α为地面的倾斜角;fr为路面滚动阻力系数;
路侧信号灯状态交通环境模型对信号灯的相位周期进行描述,表达式如下:
tr,tg,ty分别表示红灯、绿灯和黄灯的相位时间;π表示圆周率;
利用深度确定性策略梯度算法构建纯电动网联汽车路口通行生态驾驶策略,求解包含整车电池能耗最小通行时间最短的多目标优化问题,得出最优通行速度谱,具体包括:
S1:根据所述获取车辆以及路侧环境状态信息、以及所述路口通行生态驾驶模型,确定当前驾驶环境状态St,下标t代表t时刻;
S2:根据所述当前驾驶环境状态St,由深度确定性策略梯度算法的Actor-Critic架构中动作估计网络,实时输出策略动作At=μ(St|θμ),其中,θμ为动作估计网络参数,θ是每层网络的权重,μ为动作估计网络输出的加速度策略;车辆执行At,获得奖励值Rt,并进入下一时刻,产生新的驾驶环境状态St+1,并将St,At,Rt,St+1信息记录至经验缓存池中;
S3:所述动作估计网络由所述经验缓存池中采样状态数据Si,计算出由Actor-Critic架构中动作目标网络输出的策略动作μ′(Si|θμ′),其中,θμ′为动作估计网络参数,μ′为动作目标网络输出的加速度策略;
S4:Actor-Critic架构中的价值目标网络利用所述策略动作μ′(Si|θμ′)和从步骤S2所述经验缓存池中采样的状态数据集(Si,Ai,Ri,Si+1),输出价值函数目标值yi;
yi=Ri+Q′(Si+1,μ′(Si+1|θμ′)|θQ′),其中Q′为所述价值目标网络计算的行为-动作函数值,θQ′为价值目标网络参数;
S5:Actor-Critic架构中的价值估计网络利用所述动作估计网络输出的所述策略动作At、以及所述当前驾驶环境状态St,计算当前动作下的状态-动作累计期望价值QΠ(s,a),表示为:
其中,Π是当前采取的加速度策略,EΠ为系统在策略Π下的期望,γ为折扣率;
通过所述价值函数目标值yi计算损失函数值L(θQ):
计算策略动作的At梯度更新价值估计网络参数θQ:
其中α为学习率;
S6:利用所述价值估计网络计算的梯度Gt更新动作估计网络的参数θμ;
S7:更新所述动作估计网络参数和所述价值目标网络参数τ为更新权重;
S8:当车辆进入路口时,交通环境被初始化,同时初始化各个网络参数,并在第一个步长内选取随机策略,经过循环步骤S1至S7,直至车辆走完当前路口,获得一次训练的回报值其中T为车辆从路口初始位置到通过路口时所花费的时间;
S9:重复步骤S8,经过若干次训练后,将最大化回报值max Returni,并不断更新网络参数,直至每次通过路口时获得的回报值收敛,完成整个车辆在灯控信号灯路口下经济通行学习过程。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南大学,未经东南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110554621.4/1.html,转载请声明来源钻瓜专利网。