[发明专利]一种切换线性系统的数据驱动最优控制方法在审
申请号: | 201810846864.3 | 申请日: | 2018-07-27 |
公开(公告)号: | CN109116731A | 公开(公告)日: | 2019-01-01 |
发明(设计)人: | 甘明刚;张弛;陈杰;窦丽华;张蒙;赵金刚;白永强 | 申请(专利权)人: | 北京理工大学 |
主分类号: | G05B13/04 | 分类号: | G05B13/04 |
代理公司: | 北京理工大学专利中心 11120 | 代理人: | 高会允;仇蕾安 |
地址: | 100081 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种切换线性系统的数据驱动最优控制方法,能够在具体的子系统模型未知的情况下,只根据可测的系统状态量对切换线性系统进行最优切换时间的结算,从而有效实现切换线性系统的最优切换控制。该方法包括如下步骤:利用采样数据根据时变矩阵的递推式从终端时刻倒推各时刻的时变矩阵;在已估计出的时变矩阵的基础上利用采样数据根据系统状态和时变矩阵之间的相互关系推导代价函数偏导的估计;将已估计出的代价函数偏导应用于梯度下降算法实现切换时间的更新;根据计算的最优切换时间对切换线性系统进行切换控制。 | ||
搜索关键词: | 线性系统 矩阵 时变 采样数据 代价函数 数据驱动 最优控制 系统状态量 子系统模型 关系推导 系统状态 下降算法 有效实现 递推 终端 结算 更新 应用 | ||
【主权项】:
1.一种切换线性系统的数据驱动最优控制方法,其特征在于,所述切换线性系统的状态方程为
其中
为系统状态x(t)的导数,x(t)∈Rn为系统状态,x(t)状态量可测,Rn是指n维实数空间,即x(t)具有n个状态x(t)=[x1(t),x2(t),...,xn(t)]T Ai∈Rn×n是未知的子系统矩阵,Rn×n为n×n维实数空间;i∈{0,1,2,...,N}是所述切换线性系统设定的子系统切换顺序索引,N是切换次数;ti是切换时间,即为所述切换线性系统的控制量,满足t0 其中
Qf为终端加权矩阵,Qf为给定的正定对阵矩阵,满足
Q是指给定的加权矩阵,根据实际需要进行设定,Q为给定的正定对阵矩阵,满足Q=QT≥0;在优化过程中,对于任意x(t)∈Rn和t∈[t0,tf),所述切换线性系统从时刻t的状态x(t)开始,其代价函数为:
xT(t)为x(t)的转置;P(t)为时变矩阵,P(t)为对称的并且满足如下条件:![]()
为P(t)的导数;针对所述切换线性系统,采用如下步骤进行最优切换时间控制:步骤1、针对所述时变矩阵P(t):
其中δt为时间间隔,取值在(0,0.1)之间;将式(5)两端均左乘x(t′)T并右乘x(t′)得到:
其中t′是一个与时刻t无关的时刻;根据积分中值定理,得到:
其中θ1为[0,1]之间的常数;x(t′+δt)‑x(t′)=Aix(t′+θ2δt)·δt,0≤θ2≤1,t′,t′+δt∈[ti,ti+1) (8)其中θ2为[0,1]之间的常数;将(7)和(8)代入(6)可得:x(t′)TP(t+δt)x(t′)‑x(t′)TP(t)x(t′)=‑2x(t′)TP(t)(x(t′+δt)‑x(t′))‑x(t′)TQx(t′)·δt+er1(t,t′)+er2(t,t′)其中t∈[ti,ti+1),t′∈[ti,ti+1);er1(t,t′)为关于t′时刻和t时刻的第一误差;er1((t,t′)=‑2x(t′)T(P(t+θ1δt)‑P(t))Aix(t′)·δt;er2(t,t′)为关于t′时刻和t时刻的第二误差;er2(t,t′)=2x(t′)TP(t)Ai(x(t′+θ2δt)‑x(t′))·δt;得到P(t)和P(t+δt)之间的关系式如下:3x(t′)TP(t)x(t′)‑2x(t′)TP(t)x(t′+δt)=x(t′)TP(t+δt)x(t′)+x(t′)TQx(t′)·δt‑er1(t,t′)‑er2(t,t′) (9)式(9)中第一误差er1(t,t′)和第二误差er2(t,t′)忽略不计,得到如下估计:
其中
为时变矩阵P(t)的估计值;引入克罗内克Kronecker积表示(10):
其中cs(*)是矩阵*的列展开;建立如下状态参数矩阵:包括第一状态参数矩阵Ci、第二状态参数矩阵Di、第三状态参数矩阵Ei、第四状态参数矩阵Er1(t)以及第五状态参数矩阵Er2(t);i=0,1,2,...N;
其中x(t′i1)~x(t′il)分别为t′i1~t′il时刻的系统状态,ti<t′i1<t′i2<…<t′il<ti+1,l是正整数;Di=[d(t′i1),d(t′i2),...,d(t′il)]T;其中
其中r取值为1~l;x(t′ir)=[x1(t′ir),x2(t′ir),...,xn(t′ir)]T,x1(t′ir),x2(t′ir),...,xn(t′ir)为t′ir时刻系统状态x(t′ir)中的n个状态分量;i=0,1,2,...N;Ei=[ei1,ei2,...,eil]T;其中
其中x1(t′ir+δt)~xn(t′ir+δt)为t′ir+δt时刻系统状态x(t′ir+δt)中的n个状态分量;Er1(t)=[er1((t,t′i1),er1((t,t′i2),...,er1((t,t′il)]T;其中er1((t,t′ir)为关于t′ir时刻和t时刻的第一误差;r=1,2,...l;Er2(t)=[er2((t,t′i1),er2((t,t′i2),...,er2((t,t′il)]T;其中er2((t,t′ir)为关于t′ir时刻和t时刻的第二误差;r=1,2,...l;采用所述状态参数矩阵与(9)到(11)结合,获得:(3Di‑2Ei)·css(P(t))=Di·css(P(t+δt))+Ci·cs(Q)·δt‑Er1(t)‑Er2(t) (12)和
其中css(*)是对称矩阵*∈Rn×n去除重复元素的列展开;若3Di‑2Ei列满秩,式(13)直接求解:
步骤2、代价函数对切换时间ti的偏导数为:
由式(1)和式(4)得到:
用克罗内克kronecker积形式表示为:
所述状态参数矩阵还包括第六状态参数矩阵Fj、第七状态参数矩阵Gj以及第八状态参数矩阵h(ti);建立Fj和Gj;j=0,1,2,...N;
Gj=[g(t′j1),g(t′j2),...,g(t′jl)]T;其中
tj 其中t′,t′+δt∈[tj,tj+1),进而得到:(Fj‑Cj)·cs(P(ti))=2Gj·csa(P(ti)Aj) (16)csa(*)是矩阵*∈Rn×n的变换,具体变换形式为:*为矩阵B,bjr是矩阵B第j行第r列的元素;
若Gj列满秩,获得csa(P(ti)Aj)的近似值:
通过式(17)的求解结果估计偏导数如下:
其中第八状态参数矩阵为:
步骤3、采用如下迭代步骤计算最优切换时间:S1、设置迭代次数k=0,切换时间的初始值为
所述切换时间的初始值为随机设定时刻;S2、获取切换时间
并测得所述切换线性系统的状态数据;S3、取i=1,2,…,N和j=0,1,2,…N,依据步骤2计算状态参数矩阵Di,Ei,Cj,Gj,Fj和h(ti);S4、分别按照式(14)、(17)和(18)估计
和
令
S5、更新切换时间:
其中α为预设的步长,α取值在0~1之间;S6、判断
是否成立,若不成立,令k自增1,返回到S2;若成立此时
为最优切换时间;其中ε预设的阈值,其中ε<0.1;步骤4、根据计算的最优切换时间对所述切换线性系统进行切换控制。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京理工大学,未经北京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810846864.3/,转载请声明来源钻瓜专利网。