[发明专利]利用模型预测控制的逆向强化学习在审
申请号: | 202010472645.0 | 申请日: | 2020-05-29 |
公开(公告)号: | CN112906882A | 公开(公告)日: | 2021-06-04 |
发明(设计)人: | 赵金鑫;张良俊 | 申请(专利权)人: | 百度(美国)有限责任公司 |
主分类号: | G06N3/08 | 分类号: | G06N3/08;G06N20/00;G05B13/02;G05B13/04;B60W40/04;B60W40/105 |
代理公司: | 北京英赛嘉华知识产权代理有限责任公司 11204 | 代理人: | 马晓亚;王艳春 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本文描述了用于逆向强化学习以利用基于模型的优化方法和无模型学习方法的优势的系统和方法。提出了将人类行为模型与模型预测控制相结合的框架的实施方式。该框架利用神经网络的特征识别能力来确定模型预测控制的奖励函数。此外,实施本方法的实施方式,以解决实际的自动驾驶纵向控制问题,同时优先考虑安全执行和乘客舒适度。 | ||
搜索关键词: | 利用 模型 预测 控制 逆向 强化 学习 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度(美国)有限责任公司,未经百度(美国)有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202010472645.0/,转载请声明来源钻瓜专利网。
- 上一篇:一种服务提供方法、装置及系统
- 下一篇:安装有高压电池的车身