[发明专利]一种线性系统自适应最优跟踪控制方法在审

专利信息
申请号: 201910818741.3 申请日: 2019-08-30
公开(公告)号: CN112445131A 公开(公告)日: 2021-03-05
发明(设计)人: 穆朝絮;赵倩;孙长银 申请(专利权)人: 天津大学
主分类号: G05B13/04 分类号: G05B13/04
代理公司: 天津创智天诚知识产权代理事务所(普通合伙) 12214 代理人: 王海滨
地址: 300072*** 国省代码: 天津;12
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 线性 系统 自适应 最优 跟踪 控制 方法
【权利要求书】:

1.一种线性系统自适应最优跟踪控制方法,其特征在于,包括如下步骤:

步骤(1):将系统的跟踪控制转化为增广系统的稳定性控制;

步骤(2):针对增广系统,引入Q函数重构系统性能指标函数,建立基于控制依赖二次启发式规划的系统目标方程;

步骤(3):设计一个模型网络来近似估计系统的下一时刻的状态x(k+1)及系统矩阵A和B,对系统进行辨识;

步骤(4):在模型网络辨识器的基础上,构建基于控制依赖二次启发式规划的Q-learning算法,迭代获得系统的近似最优控制律

2.根据权利要求1所述的线性系统自适应最优跟踪控制方法,其特征在于,步骤(1)包括下述步骤:

(1-1)线性离散系统的系统动态如下:

其中表示系统当前时刻的状态向量,表示系统下一时刻的状态向量,表示系统的控制向量,是系统的输出,是常数矩阵,假设(A,B)是可控的,(A,C)是可观测的;

期望的参考系统的轨迹动态如下:

其中是是系统当前时刻的动态,是系统下一时刻的动态,是系统的输出,和是常数矩阵;

(1-2)构造增广系统,使原系统的跟踪控制问题转化为增广系统的镇定控制问题;基于控制系统的式(1)和参考系统的式(2),增广系统定义为

当前时刻的增广状态X(k)和系统矩阵A1,B1,C1

其中是增广系统下一时刻的状态,是增广系统的输出;

(1-3)定义如下的性能指标函数:

其中0<γ≤1是折扣因子,Ui是时刻i的效应函数,和分别是半正定对称权重矩阵和正定对称权重矩阵,代价函数(6)可以表示为

其中

性能指标函数(7)可以重新表示为

其中U(X(k),u(k))=XT(k)Q1X(k)+uT(k)Ru(k)为时刻k的效应函数;

(1-4)由式(3)和式(7)可以得知,最优线性二次型跟踪问题转化为了最优线性二次镇定问题。针对线性二次镇定问题,最优控制可以通过状态反馈实现。控制形式如下:

u(k)=-KX(k).(10)

其中K为反馈增益矩阵。由代价函数(7),可以推导出

将式(10)代入式(3)中,推导出下式

X(k+1)=(A1-B1K)X(k)=K1X(k),(12)

其中K1=A1-B1K。将式(12)代入式(11)中,可以得到性能指标函数关于增广状态X(k)的二次型形式

其中

(1-5)结合公式(9)和(13),得到增广系统的贝尔曼方程表示如下

XT(k)PX(k)=XT(k)Q1X(k)+uT(k)Ru(k)+γXT(k+1)PX(k+1).(14)

其中P是核对称矩阵;

定义哈密尔顿方程如下:

通过下式计算

可以获得最优控制为

其中

将式(3)和式(17)代入式(14)中,可以获得增广代数黎卡提方程

根据式(17)和式(18),最优控制律可以通过计算(18)中的核心矩阵P的最优值获得。然而由于(18)对于P是非线性的,因此通过(18)直接计算P是困难的,而且需要系统动态的信息。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910818741.3/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top