[发明专利]一种基于在线ADP的非线性时滞系统最优控制方法有效

申请号：	201910767886.5	申请日：	2019-08-20
公开（公告）号：	CN110609525B	公开（公告）日：	2021-11-23
发明（设计）人：	朱静;侯益静;胡天真;张鹏	申请（专利权）人：	南京航空航天大学
主分类号：	G05B19/418	分类号：	G05B19/418
代理公司：	南京瑞弘专利商标事务所(普通合伙) 32249	代理人：	石嘉蓉
地址：	210016 江***	国省代码：	江苏;32
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于在线 adp 非线性系统最优控制方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于在线ADP的非线性时滞系统最优控制方法，其特征在于：包括步骤：

步骤1、针对具有确定时滞的非线性控制系统进行数学建模，选取合适性能指标函数，通过最优控制理论构造哈密顿函数得到系统HJB方程计算得到最优控制输入；

步骤2、采用李雅普诺夫法确定最优控制输入信号下闭环系统的稳定性条件；

步骤3、采用神经网络近似最优控制输入，得到次优控制输入信号；

所述步骤1中：针对具有确定时滞的非线性控制系统进行数学建模；

时滞非线性系统可由下式描述：

式中，A为负定数阵，时滞参数τ、σ均为未知的常数，u(t)为可容许控制输入；f(t,x(t),x(t-σ))是非线性函数，并且满足利普希茨连续条件；

目的是找到合适的u^*(t)使得如下性能指标函数最小：

其中L(x(t),u(t))＝x^T(t)Qx(t)+u^T(t)Ru(t)，Q为半正定对称数阵，R为正定对称数阵；

构造哈密顿函数如下：

H(x,u,t)＝L(x,u,t)+(▽J)^T(Ax+fu) (3)

其中，

采用最优控制理论，得到Hamilton-Jacobi-Bellman方程

0＝min{H(x,u^*,t)} (4)

因此，最优控制性能指标函数为：

得到最优控制输入为：

所述步骤2中：建立最优控制输入u^*(t)下闭环系统稳定性条件：

将步骤1中所得到的最优控制输入u^*(t)，代入到式(1)中得到：

其中F(t,x(t),x(t-σ))R^-1f^T▽J^*；

通过模型变换将式(7)转换成：

通过李雅普诺夫稳定性原理，如果存在实数α，β，η₁和η₂，正定对称阵P＝P^T＞0，使得如下线性矩阵不等式成立，则由步骤1所得到的最优控制输入下的闭环系统稳定；

Φ＜0 (9)

其中

Φ＝Q₁+τQ₂+Q₃，

其中，I表示适维单位阵。

2.根据权利要求1所述的非线性时滞系统最优控制方法，其特征在于：步骤3：采用BP神经网络求解性能指标函数和最优控制输入；

将理想的性能指标函数由如下式表示：

其中，W_c为理想的神经网络权值，φ_c(x)为激活函数，ε_c(x)为神经网络近似估计误差；

基于步骤1中的Hamilton函数得到：

实际估计的性能指标函数表达式为：

其中,为神经网络实际估计权值；

采用最小化均方差根，定义误差平方：

采用梯度下降法，通过BP算法反复修正权值使式(13)最小，得到神经网络权值的调节率：

式中，γ为神经网络学习率且γ＞0；

结合式(12)，得到式(6)的最优控制输入次优表达式为

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于南京航空航天大学，未经南京航空航天大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201910767886.5/1.html，转载请声明来源钻瓜专利网。

上一篇：一种工业设备剩余寿命预测模型及其构建方法和应用
下一篇：轮式拖拉机智能总装线空中物流排布多物料管理系统

同类专利

专利分类

G 物理

G05 控制；调节
G05B 一般的控制或调节系统；这种系统的功能单元；用于这种系统或单元的监视或测试装置
G05B19-00 程序控制系统
G05B19-02 .电的
G05B19-43 .流体的
G05B19-44 ..气动的
G05B19-46 ..液压的
G05B19-04 ..除数字控制外的程序控制，即顺序控制器或逻辑控制器

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于在线ADP的非线性时滞系统最优控制方法有效

专利文献下载