[发明专利]基于分布式深度循环Q网络的交通灯控制方法在审
申请号: | 201910545162.6 | 申请日: | 2019-06-21 |
公开(公告)号: | CN110164151A | 公开(公告)日: | 2019-08-23 |
发明(设计)人: | 方敏;闫呈祥;徐维;陈烨;徐筱;李海昆 | 申请(专利权)人: | 西安电子科技大学 |
主分类号: | G08G1/08 | 分类号: | G08G1/08;G06N3/04 |
代理公司: | 陕西电子工业专利中心 61205 | 代理人: | 王品华 |
地址: | 710071 陕*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于分布式深度循环Q网络的交通灯控制方法,主要解决现有技术难以实现多路口之间协作及对多路口建模出现状态空间过大的问题。其实现方案是:1)读取城市交通路网信息,建立各个路口的车辆交通状态集合,并采用协作图的方法将读取的城市交通路网信息转换为邻接矩阵进行存储;2)根据路网中的车辆等待时间和车辆到达目的地数量,设置通用的性能评价指标;3)从各个路口车辆交通状态集合中获取各个路口各时刻的状态集、动作集和动作奖励值;4)建立分布式深度循环Q网络交通灯控制模型,根据该模型对城市路网交通灯进行控制。本发明能实现各路口之间的协作,避免了状态空间爆炸问题,可用于城市交通管理,减少城市交通拥堵。 | ||
搜索关键词: | 路口 交通灯控制 读取 城市交通路网 状态空间 协作 城市交通管理 城市交通拥堵 性能评价指标 车辆到达 车辆交通 城市路网 交通状态 邻接矩阵 路口车辆 信息转换 状态集合 网络 交通灯 通用的 状态集 建模 可用 路网 存储 集合 爆炸 奖励 | ||
【主权项】:
1.一种基于分布式深度循环Q网络的交通灯控制方法,其特征在于,包括如下:(1)读取城市交通路网信息,建立各个路口的车辆交通状态集合,并采用协作图的方法将读取的城市交通路网信息转换为邻接矩阵进行存储;(2)根据实际路网中的车辆等待时间和车辆到达目的地数量,设置通用的性能评价指标;(3)从(1)建立的各个路口车辆交通状态集合中获取各个路口各时刻的状态集、动作集和动作奖励值;(4)根据(3)获取的信息和(1)中的邻接矩阵,建立分布式深度循环Q网络交通灯控制模型:4a)将路口的历史状态值和历史动作值及当前观察的路口m作为输入,通过两个单层的多层神经网络MLP传递,得到中间值再通过长短时间神经网络LSTM得到在每一时刻的隐藏层状态其中,表示元素相加;将每一个历史时刻的数据都按照上述的公式计算,直到当前时刻t的前一时刻t‑1,将t‑1时刻的隐藏层状态设为输出4b)从邻接矩阵获取路口m的四个邻接路口me、mw、ms、mn的状态值和动作值计算每一个邻接路口的隐藏层状态:第一个邻接路口的隐藏层状态为第二个邻接路口的隐藏层状态为第三个邻接路口的隐藏层状态为第四个邻接路口的隐藏层状态为将第四个邻接路口的隐藏层状态设为输出4c)将路口m自身历史数据训练得到的输出和其四个邻接路口计算得到的输出通过多层神经网络MLP选择路口m在t时刻的最佳执行动作(5)根据(4)构建的模型对城市路网交通灯进行控制:5a)初始化路网中路口的邻接矩阵及分布式深度循环Q网络中的学习率α=0.25、折扣因子γ=0.9、ε‑贪心策略中的ε=0.01、网络参数θ=0、迭代上限T=1000、迭代次数t=1、隐藏层状态h=0;5b)根据ε‑贪心策略选择路口的执行动作;5c)对每一个路口执行所选择的动作,并计算获取分布式深度循环Q网络的即时奖励;5d)计算分布式深度循环Q网络的损失函数误差,更新网络参数θ;5e)设t=t+1,将路口状态st转变为st+1,5f)判断迭代是否停止,若t小于迭代上限T,转5b),否则,停止。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910545162.6/,转载请声明来源钻瓜专利网。