[发明专利]一种基于Q学习的交通信号控制方法在审
申请号: | 201911301069.7 | 申请日: | 2019-12-17 |
公开(公告)号: | CN111081035A | 公开(公告)日: | 2020-04-28 |
发明(设计)人: | 胡春良;潘翔;柏志玮;邓忠飞;胡雅旭;张庆鹏;谢明亮 | 申请(专利权)人: | 扬州市鑫通智能信息技术有限公司 |
主分类号: | G08G1/07 | 分类号: | G08G1/07 |
代理公司: | 北京棘龙知识产权代理有限公司 11740 | 代理人: | 谢静 |
地址: | 225600 江苏省*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 学习 交通信号 控制 方法 | ||
本发明涉及交通控制工程技术领域,且公开了一种基于Q学习的交通信号控制方法,其特征在于,包括以下步骤:信息采集;对于每一个时刻,获取交叉口的所有车道的排队车辆信息。该基于Q学习的交通信号控制方法,通过使用Q学习方法训练Q值表得到在车道排队车辆给定的情况下,执行不同灯态的不同Q值,根据训练好的Q值表,选取使得Q值表最大的灯态动作用于信号控制,最终使得交通信号的控制可以适应交通路网的随机性,从而达到更好的控制效率,解决了现有技术中计算方式难以达成多段十字交通路口的车流汇集,所计算出时间的信号控制忽视了路网的随机性,无法适应当前城市道路交通情况,导致车辆通行效率低n,延误时间长的问题。
技术领域
本发明涉及交通控制工程技术领域,具体为一种基于Q学习的交通信号控制方法。
背景技术
汽车的发明给人民的出行生活带来了极大的便利,但是随着社会经济的发展,城市汽车数量急剧增加却又带来了一系列交通问题,其中交通拥堵问题尤为突出。采用合理的信号控制方案是缓解交通拥堵的有效方法。目前,城市里大多数交通信号灯都采用定时控制,即根据历史交通流量预先计算出交通相位及时长,使信号灯以固定的时间进行切换。
根据中国专利申请公布号为CN 105654744 A提出的一种基于Q学习的改进交通信号控制方法,该基于Q学习的改进交通信号控制方法具有减少车辆停靠时间和节能减排的优点,但已经暴露出了其诸多缺陷,该种计算方式难以达成多段十字交通路口的车流汇集,所计算出时间的信号控制忽视了路网的随机性,无法适应当前城市道路交通情况,导致车辆通行效率低,延误时间长的缺点,故而提出一种基于Q学习的交通信号控制方法解决上述所提出的问题。
发明内容
(一)解决的技术问题
针对现有技术的不足,本发明提供了一种基于Q学习的交通信号控制方法,具备可以适应交通路网的随机性等优点,解决了现有技术中计算方式难以达成多段十字交通路口的车流汇集,所计算出时间的信号控制忽视了路网的随机性,无法适应当前城市道路交通情况,导致车辆通行效率低,延误时间长的问题。
(二)技术方案
为实现上述可以适应交通路网随机性的目的,本发明提供如下技术方案:一种基于Q学习的交通信号控制方法,包括以下步骤:
1)信息采集;对于每一个时刻,获取交叉口的所有车道的排队车辆信息,以及信号灯的灯态信息并按照连续时刻一一对应;
2)原始车辆灯态数据预处理;获得排队车辆-灯态数据集{Vk,Sk,Vk+1},其中,Vk为第k时刻各个车道排队车辆的个数,k=1,2,…,K,K为该数据集合中的数据个数;
3)利用排队车辆-灯态数据集{Vk,Sk,Vk+1},更新Q学习中的Q值表
4)根据得到的Q值表,可以给出基于Q学习的最优控制方案:在实际信号控制中,利用传感器获取当前路网中的排队车辆信息Vnow,根据Q值表,得到下一步应当执行的信号灯状态Snext。
优选的,所述K为该数据集合中的数据个数,计算过程为,剔除明显异常数据,如排队车辆变化量不符合常识的数据,将过车时刻数据按照时间顺序梳理,获取数据集合{Vk,Sk,Vk+1}。
优选的,所述步骤3中对每个V,S初始化表项为,对于每一个数据(Vk,Sk,Vk+1),定义Q学习中的奖励值;
r=-Vk。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于扬州市鑫通智能信息技术有限公司,未经扬州市鑫通智能信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911301069.7/2.html,转载请声明来源钻瓜专利网。