[发明专利]一种具有适应性的DQN模型优化方法及应用在审
申请号: | 202211392142.8 | 申请日: | 2022-11-08 |
公开(公告)号: | CN115903485A | 公开(公告)日: | 2023-04-04 |
发明(设计)人: | 谭墍元;袁倩;郭伟伟;刘福裕 | 申请(专利权)人: | 北方工业大学 |
主分类号: | G05B13/04 | 分类号: | G05B13/04;G08G1/08;G08G1/01 |
代理公司: | 深圳市育科知识产权代理有限公司 44509 | 代理人: | 洪秀凤 |
地址: | 100144 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 具有 适应性 dqn 模型 优化 方法 应用 | ||
1.一种具有适应性的DQN模型优化方法,其特征在于,包括以下步骤:
S1、设计道路交叉口,定义DQN模型的状态、动作和奖励函数,并设置DQN模型的超参数;
S2、基于所述道路交叉口,设定多个交通场景;
S3、基于所述多个交通场景对DQN模型分别进行训练,得到多个训练后的DQN模型;
S4、基于所述道路交叉口,设定与所述多个交通场景不同的新交通场景;
S5、将所述多个交通场景中的至少一个交通场景以及所述新交通场景作为测试交通场景,基于测试交通场景对所述多个训练后的DQN模型分别进行适应性检验,筛选得到优化后的DQN模型。
2.如权利要求1所述的具有适应性的DQN模型优化方法,其特征在于,所述道路交叉口设计为包括四个方向的十字形道路交叉口,四个方向包括东向、西向、北向和南向,各个方向均为双向四车道,构成八个流向,双向四车道包括一条左转车道、两条直行车道和一条右转车道。
3.如权利要求1所述的具有适应性的DQN模型优化方法,其特征在于,所述状态定义为道路交叉口运行状态S,所述道路交叉口运行状态S通过车辆排队长度qi进行表征,其中,qi为道路交叉口各流向对应车道的车辆排队长度,八维矩阵st=[q1,q2,q3,q4,q5,q6,q7,q8]为t时刻时道路交叉口的道路交叉口运行状态;
所述动作定义为四相位集合A,A={NSL,NSS,WEL,WES},其中,NSL表示南北方向左转通行,NSS表示南北方向直行通行,WEL表示东西方向左转通行,WES表示东西方向直行通行;
所述奖励函数定义为车均延误时间的相反数,奖励函数的表达式为:其中,rt为t时刻时道路交叉口的奖励函数;α为权重系数,α=1;为t时刻时道路交叉口的车均延误时间;Δt为仿真时间步长。
4.如权利要求1所述的具有适应性的DQN模型优化方法,其特征在于,DQN模型的超参数包括仿真时长、仿真次数、迭代数、经验池容量、批处理大小、学习率β、折扣系数γ、单位绿灯时长gt和单位黄灯时长yt;
其中,DQN模型的超参数初始化值为:仿真时长6000、仿真次数200、迭代数4、经验池容量50000、批处理大小400、学习率β=0.0003、折扣系数γ=0.9、单位绿灯时长gt=6和单位黄灯时长yt=3。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北方工业大学,未经北方工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211392142.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种PCB板和服务器
- 下一篇:判别血栓弹力检测系统状态的方法及系统