[发明专利]基于求解的内省来增强强化学习智能体的训练以对机器人和自主载具进行控制和规划在审
申请号: | 201980082774.4 | 申请日: | 2019-11-21 |
公开(公告)号: | CN113196308A | 公开(公告)日: | 2021-07-30 |
发明(设计)人: | M·A·沃伦;C·塞拉诺 | 申请(专利权)人: | 赫尔实验室有限公司 |
主分类号: | G06N3/08 | 分类号: | G06N3/08;G06N5/00;G06N3/00;G06N3/04 |
代理公司: | 北京三友知识产权代理有限公司 11127 | 代理人: | 师玮;王小东 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 描述了一种用于控制移动平台的系统。基于移动平台的当前状态,训练在移动平台上运行的神经网络。周期性地查询能够对非线性激活函数进行推理的可满足性模理论(SMT)解算器,以获得满足移动平台的指定约束的状态示例。然后在所述状态示例上训练神经网络。在所述状态示例上训练之后,神经网络选择要由移动平台在其环境中执行的动作。最后,系统使移动平台在其环境中执行所选择的动作。 | ||
搜索关键词: | 基于 求解 内省 增强 强化 学习 智能 训练 机器 人和 自主 进行 控制 规划 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于赫尔实验室有限公司,未经赫尔实验室有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201980082774.4/,转载请声明来源钻瓜专利网。
- 上一篇:测试条指示器确定系统、终端设备和方法
- 下一篇:用于活检的组织样本收集器