[发明专利]用于自主驾驶应用的无监督学习代理有效
申请号: | 201810986094.2 | 申请日: | 2018-08-28 |
公开(公告)号: | CN109460015B | 公开(公告)日: | 2022-04-15 |
发明(设计)人: | P·帕拉尼萨梅;U·P·穆达里戈 | 申请(专利权)人: | 通用汽车环球科技运作有限责任公司 |
主分类号: | G05D1/02 | 分类号: | G05D1/02 |
代理公司: | 中国专利代理(香港)有限公司 72001 | 代理人: | 邓雪萌;傅永霄 |
地址: | 美国密*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 提供了用于控制车辆的系统和方法。在一个实施例中,提供了一种包括训练自主驾驶代理的计算机实施方法,该方法包括以下步骤:由处理器使用神经网络从驾驶行为的演示中提取信息;将提取的信息传输到发生器模块;将与驾驶行为的演示相关联的真实环境状态传输到鉴别器模块;由处理器使用发生器模块从提取的信息中产生环境状态解译;由处理器训练鉴别器模块以更好地确定所产生的环境状态解译是否对应于真实环境状态,同时由处理器训练发生器模块以产生鉴别器确定对应于真实环境状态的改进的环境状态解译;并且由处理器使用从经过训练的发生器模块中产生的环境状态解译来恢复奖励图。 | ||
搜索关键词: | 用于 自主 驾驶 应用 监督 学习 代理 | ||
【主权项】:
1.一种训练自主驾驶代理的计算机实施方法,所述方法包括以下步骤:由处理器使用神经网络从驾驶行为的演示中提取信息;由处理器从所述提取的信息中恢复奖励图;将所述提取的信息传输到发生器模块;将与驾驶行为的所述演示相关联的真实环境状态和所述恢复的奖励图传输到鉴别器模块;由处理器使用所述发生器模块从所述提取的信息中产生环境状态解译;由处理器训练所述鉴别器模块以更好地确定所产生的环境状态解译是否对应于所述真实环境状态,同时由处理器训练所述发生器模块以产生所述鉴别器确定对应于所述真实环境状态的改进的环境状态解译。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于通用汽车环球科技运作有限责任公司,未经通用汽车环球科技运作有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810986094.2/,转载请声明来源钻瓜专利网。