[发明专利]一种基于协同演化的自动驾驶车辆决策涌现方法有效
申请号: | 202010065627.0 | 申请日: | 2020-01-20 |
公开(公告)号: | CN111258314B | 公开(公告)日: | 2022-07-15 |
发明(设计)人: | 刘章杰;李慧云 | 申请(专利权)人: | 中国科学院深圳先进技术研究院 |
主分类号: | G05D1/02 | 分类号: | G05D1/02 |
代理公司: | 北京市诚辉律师事务所 11430 | 代理人: | 耿慧敏 |
地址: | 518055 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 协同 演化 自动 驾驶 车辆 决策 涌现 方法 | ||
本发明提供一种基于协同演化的自动驾驶车辆决策涌现方法。该方法包括:构建道路模型,并确定车辆在道路模型中的初始位置分布和行驶目的地;设置多个候选驾驶策略用于限定车辆的行驶速度以及前车与后车的交互关系,并根据所述多个候选驾驶策略将车辆划分到不同的种群;根据车辆运动学模型、预设的交通信号灯调度策略以及车辆对应的候选驾驶策略运行车辆;以控制车辆的多个行驶指标为优化目标,探索所述多个候选驾驶策略的优劣。本发明针对多个全局目标的优化,使得最优驾驶策略自发涌现。
技术领域
本发明涉及自动驾驶技术领域,尤其涉及一种基于协同演化的自动驾驶车辆决策涌现方法。
背景技术
目前,城市交通规模大,动态多,变化大的特点导致交通运输系统和交通规则几乎无法应对瞬息万变的交通状况,并且无法及时对单个车辆进行合理的规划和调度。
在现有技术中,中心化调度方法通常适用于小规模的情况。例如,中心化调度模型可以解决交通灯调度的最优性,提高交通吞吐量,并减少交叉路口的等待时间。然而,中心化优化算法(包括强化学习,神经网络和模糊逻辑等)的计算复杂度将随着路口数量,车辆数量和道路长度的增加而呈指数增长。而且,城市车辆网络的动态和瞬时变化的特点使得难以通过中心化优化调度算法及时响应各个车辆和各种交通状况。
目前的进化算法(例如遗传算法等)和一些智能优化算法(例如蚁群算法,粒子群算法,模拟退火算法等)对于具有固有特征分布的大规模问题比较有效。然而,这些传统的进化算法未能将个体之间以及环境之间竞争与合作的影响结合在一起,随着个体车辆与环境之间V2X技术的发展,这种影响变得更加明显和突出。
发明内容
本发明的目的在于克服上述现有技术的缺陷,提供一种基于协同演化的自动驾驶车辆决策涌现方法,通过模拟竞争与合作的协同进化过程,以观察在不同环境下最优驾驶策略的涌现。
根据本发明的第一方面,提供了一种基于协同演化的自动驾驶车辆决策涌现方法。该方法包括以下步骤:
构建道路模型,并确定车辆在道路模型中的初始位置分布和行驶目的地;
设置多个候选驾驶策略用于限定车辆的行驶速度以及前车与后车的交互关系,并根据所述多个候选驾驶策略将车辆划分到不同的种群;
根据车辆运动学模型、预设的交通信号灯调度策略以及车辆对应的候选驾驶策略运行车辆;
以控制车辆的多个行驶指标为优化目标,探索所述多个候选驾驶策略的优劣。
在一个实施例中,所述构建道路模型,并设置车辆在道路模型中的初始位置分布和行驶目的地包括:
构建带交叉口的双向四车道道路模型,其中道路由栅格组成,每个栅格都是一个矩形,栅格长度被设置为等于车辆长度;
将随机设置车辆的初始分布并随机设置车辆目的地,当车辆中心点落入道路模型的网格中时,认为网格被占据。
在一个实施例中,所述多个候选驾驶策略包括:
保守策略:用于限定车辆以最大速度行驶,当前车的速度较慢时减速,不要超车;
理性策略:用于限定以最大的速度行驶,当前车的速度较慢并且变道相关20米区域内没有车辆汇入时超车;
贪婪策略:用于限定以最高速度行驶,始终超车。
在一个实施例中,所述交通信号灯调度策略是固定时间片轮转,每个时间片为8秒。
在一个实施例中,所述多个行驶指标包括平均通行时间、事故率,平均排放、平均能耗中的至少两项。
根据本发明的第二方面,提供一种计算机可读存储介质,其上存储有计算机程序,其中,该程序被处理器执行时实现本发明上述方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院深圳先进技术研究院,未经中国科学院深圳先进技术研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010065627.0/2.html,转载请声明来源钻瓜专利网。