[发明专利]一种基于强化学习和李雅普诺夫函数的鲁棒控制方法有效
申请号: | 201911260424.0 | 申请日: | 2019-12-10 |
公开(公告)号: | CN110928189B | 公开(公告)日: | 2022-04-29 |
发明(设计)人: | 潘杰森;郑磊;成慧;胡海峰 | 申请(专利权)人: | 中山大学 |
主分类号: | G05B13/04 | 分类号: | G05B13/04 |
代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 陈伟斌 |
地址: | 510275 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种基于强化学习和李雅普诺夫函数的鲁棒控制方法,通过自适应在线贝叶斯推理对机器人动力学进行建模,基于李雅普诺夫构造带约束强化学习问题,通过构建控制李雅普诺夫函数和控制屏障函数策略,实现机器人高效性学习、稳定性工作、安全探索;解决了非线性、混合动力学安全关键机器人系统在状态、动作空间受限的任务场景中,面对自身系统不确定性和外部环境不确定性存在不安全性、不稳定、不高效的技术问题。 | ||
搜索关键词: | 一种 基于 强化 学习 李雅普诺夫 函数 鲁棒控制 方法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中山大学,未经中山大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201911260424.0/,转载请声明来源钻瓜专利网。
- 上一篇:一种抗氧化组合物及其应用
- 下一篇:一种高速起降防坠飞机
- 控制系统的李雅普诺夫指数谱的计算方法
- 一种基于非对称时不变障碍李雅普诺夫函数的四旋翼飞行器输出受限反步控制方法
- 一种基于非对称时变障碍李雅普诺夫函数的四旋翼飞行器输出受限反步控制方法
- 一种基于对称时变障碍李雅普诺夫函数的四旋翼飞行器输出受限反步控制方法
- 一种基于对称时不变障碍李雅普诺夫函数的四旋翼飞行器全状态受限反步控制方法
- 基于对称时变正切型约束李雅普诺夫函数的四旋翼飞行器输出受限控制方法
- 基于对称时不变正切型约束李雅普诺夫函数的四旋翼飞行器输出受限控制方法
- 基于非对称时不变正切型约束李雅普诺夫函数的四旋翼飞行器全状态受限控制方法
- 基于对称时不变正切型约束李雅普诺夫函数的四旋翼飞行器全状态受限控制方法
- 基于对称时变反正切型约束李雅普诺夫函数的四旋翼飞行器输出受限控制方法