[发明专利]用于强化学习控制的约束适配器在审
申请号: | 202080057129.X | 申请日: | 2020-05-13 |
公开(公告)号: | CN114222952A | 公开(公告)日: | 2022-03-22 |
发明(设计)人: | U·卡拉比克;李照剑;A·古德史密斯 | 申请(专利权)人: | 三菱电机株式会社 |
主分类号: | G05B13/04 | 分类号: | G05B13/04;G05B13/02;G06N20/00 |
代理公司: | 北京三友知识产权代理有限公司 11127 | 代理人: | 原宏宇;孙东喜 |
地址: | 日本*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 提供了一种用于控制机器的操作的系统,该机器经受机器的连续状态空间中的状态约束并且经受机器的连续控制输入空间中的控制输入约束。该设备包括:输入接口,输入接口用于接受指示机器状态的数据;存储器,存储器被配置为存储优化问题和控制策略,优化问题用于计算满足状态约束的状态和动作对的安全裕度,控制策略将机器的在控制不变集合CIS内的状态映射到满足控制输入约束的控制输入;以及处理器,处理器被配置为迭代地执行强化学习RL算法以联合地控制机器并更新控制策略。 | ||
搜索关键词: | 用于 强化 学习 控制 约束 适配器 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于三菱电机株式会社,未经三菱电机株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202080057129.X/,转载请声明来源钻瓜专利网。
- 上一篇:包括固相和液相的电化学材料
- 下一篇:控制系统、信息处理装置以及程序