[发明专利]基于分布式深度循环Q网络的交通灯控制方法在审
申请号: | 201910545162.6 | 申请日: | 2019-06-21 |
公开(公告)号: | CN110164151A | 公开(公告)日: | 2019-08-23 |
发明(设计)人: | 方敏;闫呈祥;徐维;陈烨;徐筱;李海昆 | 申请(专利权)人: | 西安电子科技大学 |
主分类号: | G08G1/08 | 分类号: | G08G1/08;G06N3/04 |
代理公司: | 陕西电子工业专利中心 61205 | 代理人: | 王品华 |
地址: | 710071 陕*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 路口 交通灯控制 读取 城市交通路网 状态空间 协作 城市交通管理 城市交通拥堵 性能评价指标 车辆到达 车辆交通 城市路网 交通状态 邻接矩阵 路口车辆 信息转换 状态集合 网络 交通灯 通用的 状态集 建模 可用 路网 存储 集合 爆炸 奖励 | ||
1.一种基于分布式深度循环Q网络的交通灯控制方法,其特征在于,包括如下:
(1)读取城市交通路网信息,建立各个路口的车辆交通状态集合,并采用协作图的方法将读取的城市交通路网信息转换为邻接矩阵进行存储;
(2)根据实际路网中的车辆等待时间和车辆到达目的地数量,设置通用的性能评价指标;
(3)从(1)建立的各个路口车辆交通状态集合中获取各个路口各时刻的状态集、动作集和动作奖励值;
(4)根据(3)获取的信息和(1)中的邻接矩阵,建立分布式深度循环Q网络交通灯控制模型:
4a)将路口的历史状态值和历史动作值及当前观察的路口m作为输入,通过两个单层的多层神经网络MLP传递,得到中间值再通过长短时间神经网络LSTM得到在每一时刻的隐藏层状态
其中,表示元素相加;
将每一个历史时刻的数据都按照上述的公式计算,直到当前时刻t的前一时刻t-1,将t-1时刻的隐藏层状态设为输出
4b)从邻接矩阵获取路口m的四个邻接路口me、mw、ms、mn的状态值和动作值计算每一个邻接路口的隐藏层状态:
第一个邻接路口的隐藏层状态为
第二个邻接路口的隐藏层状态为
第三个邻接路口的隐藏层状态为
第四个邻接路口的隐藏层状态为
将第四个邻接路口的隐藏层状态设为输出
4c)将路口m自身历史数据训练得到的输出和其四个邻接路口计算得到的输出通过多层神经网络MLP选择路口m在t时刻的最佳执行动作
(5)根据(4)构建的模型对城市路网交通灯进行控制:
5a)初始化路网中路口的邻接矩阵及分布式深度循环Q网络中的学习率α=0.25、折扣因子γ=0.9、ε-贪心策略中的ε=0.01、网络参数θ=0、迭代上限T=1000、迭代次数t=1、隐藏层状态h=0;
5b)根据ε-贪心策略选择路口的执行动作;
5c)对每一个路口执行所选择的动作,并计算获取分布式深度循环Q网络的即时奖励;
5d)计算分布式深度循环Q网络的损失函数误差,更新网络参数θ;
5e)设t=t+1,将路口状态st转变为st+1,
5f)判断迭代是否停止,若t小于迭代上限T,转5b),否则,停止。
2.根据权利要求1所述的方法,其特征在于:(1)中建立各个路口的车辆交通状态集合,表示为其中:
i:表示路网中任意一个路口;
Li:表示路网中某个路口的全部入口车道;
TLi:表示任意路口的入口车道所对应的交通灯;
由三元组[tli,pos,des]组成,其中pos为车辆当前时刻所处的位置、des为目的地、tli为所处车道li上的交通灯;
ai:表示交通灯tli的动作,交通灯的动作对应于交通灯的状态。
3.根据权利要求1所述方法,其特征在于:(2)中根据实际路网中的车辆等待时间和车辆到达目的地数量,设置通用的性能评价指标,包括路口平均等待时间AJ、车辆平均行驶等待时间AT和到达目的地的总车辆数V。
4.根据权利要求3所述方法,其特征在于:所述路口平均等待时间AJ,用于反应单个车辆在路口的平均等待时间,定义如下:
其中,PT为通过路口的所有车辆总的等待时间,n为通过该路口的车辆总数;AJ越小,说明路口拥堵时间越少,反之,路口拥堵时间越长。
5.根据权利要求3所述方法,其特征在于:所述车辆平均行驶等待时间AT,用于反应单个车辆行车全程所需的平均等待时间,定义如下:
其中,DT为所有到达目的车辆总的等待时间,N为车辆总数;AT越小,说明路口拥堵时间越少,反之,路口拥堵时间越长。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910545162.6/1.html,转载请声明来源钻瓜专利网。