[发明专利]利用第一原则和约束进行有效、连续和安全学习的系统和方法在审
申请号: | 201980068079.2 | 申请日: | 2019-04-23 |
公开(公告)号: | CN113015981A | 公开(公告)日: | 2021-06-22 |
发明(设计)人: | 刘立峰;朱颖璇;张军;殷晓田;李剑;陶永祥;梁达尧 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | G06N3/08 | 分类号: | G06N3/08;G05B13/04 |
代理公司: | 北京龙双利达知识产权代理有限公司 11329 | 代理人: | 钞朝燕;王君 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种用于控制系统的自学习的计算机实现的方法。该方法包括创建初始知识库。该方法使用该知识库学习第一原则。该方法创建从该知识库导出的初始控制命令。该方法生成用于该控制命令的约束。该方法通过执行具有该约束的该控制命令并观察反馈,执行约束强化学习以改善该控制命令。该方法基于该反馈来丰富该知识库。 | ||
搜索关键词: | 利用 第一 原则 约束 进行 有效 连续 安全 学习 系统 方法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201980068079.2/,转载请声明来源钻瓜专利网。
- 上一篇:具有快速连接和断开的模具
- 下一篇:一种检测方法、检测装置以及存储介质