[发明专利]一种基于加强学习的最优跟踪控制算法在审
申请号: | 202110081538.X | 申请日: | 2021-01-21 |
公开(公告)号: | CN112925203A | 公开(公告)日: | 2021-06-08 |
发明(设计)人: | 王雨佳;杨佳锷;王牧原;杨佳喆 | 申请(专利权)人: | 深圳翱诺科技有限公司 |
主分类号: | G05B13/04 | 分类号: | G05B13/04 |
代理公司: | 北京君恒知识产权代理有限公司 11466 | 代理人: | 张林 |
地址: | 150001 黑龙江省哈*** | 国省代码: | 黑龙江;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 加强 学习 最优 跟踪 控制 算法 | ||
1.一种基于加强学习的最优跟踪控制算法,其特征在于:该方法包括以下步骤:
步骤一:建立非线性系统的数学模型;
步骤二:定义系统跟踪误差,建立无限域性能指标;
步骤三:求取最优跟踪控制策略;
步骤四:求取近似最优跟踪控制器。
2.根据权利要求1所述的一种基于加强学习的最优跟踪控制算法,其特征在于:步骤一中的非线性系统为:
其中,代表系统的n维状态向量,和分别表示系统的非线性模型函数,代表系统的m维控制输入。
3.根据权利要求2所述的一种基于加强学习的最优跟踪控制算法,其特征在于:步骤二中的定义系统的跟踪误差向量如下:
e=x-xd
则,根据步骤一中的非线性系统,表示误差动态如下
设计新型的无限域性能指标如下:
其中:
4.根据权利要求1所述的一种基于加强学习的最优跟踪控制算法,其特征在于:最优跟踪控制策略利用哈密顿方程求取。
5.根据权利要求1所述的一种基于加强学习的最优跟踪控制算法,其特征在于:最优跟踪控制策略利用迭代学习和神经网络技术求取。
6.根据权利要求1所述的一种基于加强学习的最优跟踪控制算法,其特征在于:仿真验证基于加强学习的最优跟踪控制算法的有效性。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳翱诺科技有限公司,未经深圳翱诺科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110081538.X/1.html,转载请声明来源钻瓜专利网。