[发明专利]经执行器-评价网络架构学习车道变换策略的方法和系统有效
申请号: | 201910496094.9 | 申请日: | 2019-06-10 |
公开(公告)号: | CN111137292B | 公开(公告)日: | 2023-08-08 |
发明(设计)人: | P·帕拉尼萨梅;U·P·穆达里格;陈亦伦;J·M·多兰;K·米林 | 申请(专利权)人: | 通用汽车环球科技运作有限责任公司;卡内基梅隆大学 |
主分类号: | B60W30/18 | 分类号: | B60W30/18;G06N3/0464;G06N3/084;G06N3/045;G06N3/0442;G06V10/774;G06V10/82 |
代理公司: | 中国专利代理(香港)有限公司 72001 | 代理人: | 刘桢;王丽辉 |
地址: | 美国密*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 提供了采用基于空间和时间注意力的分层车道变换策略的深度强化学习来控制自主车辆的系统和方法。执行器‑评价网络架构包括:执行器网络,其处理从环境接收的图像数据以将车道变换策略作为分层动作的集合来学习;以及评价网络,其评估车道变换策略以计算损失和梯度来预测动作值函数(Q),其用于驱动学习车道变换策略以及更新其参数。执行器‑评价网络架构实施空间注意力模块以选择图像数据中重要的相关区域,以及时间注意力模块以学习要应用于过去的图像数据帧的时间注意力权重,从而指示在决定选择哪个车道变换策略时的相对重要性。 | ||
搜索关键词: | 执行 评价 网络 架构 学习 车道 变换 策略 方法 系统 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于通用汽车环球科技运作有限责任公司;卡内基梅隆大学,未经通用汽车环球科技运作有限责任公司;卡内基梅隆大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910496094.9/,转载请声明来源钻瓜专利网。