[发明专利]交叉口交通信号控制方法和设备有效
申请号: | 201510665966.1 | 申请日: | 2015-10-15 |
公开(公告)号: | CN105279978B | 公开(公告)日: | 2018-05-25 |
发明(设计)人: | 王飞跃;刘裕良;段艳杰;吕宜生;朱凤华;苟超 | 申请(专利权)人: | 青岛智能产业技术研究院;青岛慧城智能科技有限公司 |
主分类号: | G08G1/07 | 分类号: | G08G1/07 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 吕雁葭 |
地址: | 266109 山东省青岛*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种交叉口交通信号控制方法,该方法能够根据交通状态,通过环境反馈进行学习,从而实现对交通信号的自适应控制。该方法包括:定义系统参数;建立Action网络和Critic网络;初始化控制器;根据系统状态得到相应系统控制参数;根据状态和动作得到性能指标;交替训练Critic网络和Action网络;达到训练目标之后记录网络权值;以及使用训练好的Critic网络和Action网络进行在线控制。本发明利用ADHDP方法对交叉口交通信号的自适应控制提供了一种有效途径。 | ||
搜索关键词: | 交叉口交通信号 网络 自适应控制 初始化控制器 系统控制参数 方法和设备 定义系统 环境反馈 交通信号 交通状态 系统状态 训练目标 有效途径 在线控制 网络权 记录 学习 | ||
【主权项】:
1.一种用于交叉口交通信号控制的ADHDP控制器离线训练方法,该ADHDP控制器包括Action网络和Critic网络,该方法包括:在步骤S1,定义系统状态、回报函数、绿信比和系统控制参数;在步骤S2,建立Action网络和Critic网络,其中:Action网络为具有一个隐层的BP神经网络,其中输入层神经元个数为P,输出层神经元个数为P-1,隐层的神经元个数为Ma ,Ma 为经验值;以及Critic网络为具有一个隐层的BP神经网络,其中输入层神经元个数为2P-1,输出层神经元个数为1,隐层的神经元个数为Mc ,Mc 为经验值;在步骤S3,初始化ADHDP控制器,包括:初始化Action网络权值和初始化Critic网络权值;在步骤S4,在每个控制周期结束前,获取系统状态,输入至Action网络,输出相应系统控制参数u(k),将系统控制参数u(k)输出至仿真软件以指导下一个周期的运行;在步骤S5,将系统状态S(k)和系统控制参数u(k)输入至Critic网络,输出性能指标J(k);在步骤S6,交替地根据性能指标和回报函数训练Critic网络以及根据性能指标训练Action网络,以更新Critic网络的权值和Action网络的权值;以及在步骤S7,判断是否达到预期设定的目标:当达到预期设定的目标时,在步骤S8,离线训练结束,记录最终的Action网络的权值和Critic网络的权值;否则,返回步骤S6继续训练。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于青岛智能产业技术研究院;青岛慧城智能科技有限公司,未经青岛智能产业技术研究院;青岛慧城智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510665966.1/,转载请声明来源钻瓜专利网。