[发明专利]一种切换线性系统的数据驱动最优控制方法在审
申请号: | 201810846864.3 | 申请日: | 2018-07-27 |
公开(公告)号: | CN109116731A | 公开(公告)日: | 2019-01-01 |
发明(设计)人: | 甘明刚;张弛;陈杰;窦丽华;张蒙;赵金刚;白永强 | 申请(专利权)人: | 北京理工大学 |
主分类号: | G05B13/04 | 分类号: | G05B13/04 |
代理公司: | 北京理工大学专利中心 11120 | 代理人: | 高会允;仇蕾安 |
地址: | 100081 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 线性系统 矩阵 时变 采样数据 代价函数 数据驱动 最优控制 系统状态量 子系统模型 关系推导 系统状态 下降算法 有效实现 递推 终端 结算 更新 应用 | ||
1.一种切换线性系统的数据驱动最优控制方法,其特征在于,
所述切换线性系统的状态方程为
其中为系统状态x(t)的导数,x(t)∈Rn为系统状态,x(t)状态量可测,Rn是指n维实数空间,即x(t)具有n个状态x(t)=[x1(t),x2(t),...,xn(t)]T Ai∈Rn×n是未知的子系统矩阵,Rn×n为n×n维实数空间;i∈{0,1,2,...,N}是所述切换线性系统设定的子系统切换顺序索引,N是切换次数;ti是切换时间,即为所述切换线性系统的控制量,满足
t0<t1<…<tN-1<tN<tN+1=tf;其中t0=0是初始时间,tf是终端时间;
所述切换线性系统的有限时间代价函数为:
其中Qf为终端加权矩阵,满足Q是指给定的加权矩阵,根据实际需要进行设定,满足Q=QT≥0;
在优化过程中,对于任意x(t)∈Rn和t∈[t0,tf),所述切换线性系统从时刻t的状态x(t)开始,其代价函数为:
x(t)T为x(t)的转置;P(t)为时变矩阵,P(t)为对称的并且满足如下条件:
为P(t)的导数;
针对所述切换线性系统,采用如下步骤进行最优切换时间控制:
步骤1、针对所述时变矩阵P(t):
其中δt为时间间隔,取值在(0,0.1)之间;
将式(5)两端均左乘x(t′)T并右乘x(t′)得到:
其中t′是一个与时刻t无关的时刻;根据积分中值定理,得到:
其中θ1为[0,1]之间的常数;
x(t′+δt)-x(t′)=Aix(t′+θ2δt)·δt,0≤θ2≤1,t′,t′+δt∈[ti,ti+1) (8)
其中θ2为[0,1]之间的常数;
将式(7)和式(8)代入式(6)可得:
x(t′)TP(t+δt)x(t′)-x(t′)TP(t)x(t′)
=-2x(t′)TP(t)(x(t′+δt)-x(t′))-x(t′)TQx(t′)·δt+er1(t,t′)+er2(t,t′)
其中t∈[ti,ti+1),t′∈[ti,ti+1);
er1(t,t′)为关于t′时刻和t时刻的第一误差;
er1(t,t′)=-2x(t′)T(P(t+θ1δt)-P(t))Aix(t′)·δt;
er2(t,t′)为关于t′时刻和t时刻的第二误差;
er2(t,t′)=2x(t′)TP(t)Ai(x(t′+θ2δt)-x(t′))·δt;
得到P(t)和P(t+δt)之间的关系式如下:
3x(t′)TP(t)x(t′)-2x(t′)TP(t)x(t′+δt)=x(t′)TP(t+δt)x(t′)+x(t′)TQx(t′)·δt-er1(t,t′)-er2(t,t′) (9)
式(9)中第一误差er1(t,t′)和第二误差er2(t,t′)忽略不计,得到如下估计:
其中为时变矩阵P(t)的估计值;
引入克罗内克Kronecker积表示(10):
其中cs(*)是矩阵*的列展开;
建立如下状态参数矩阵:包括第一状态参数矩阵Ci、第二状态参数矩阵Di、第三状态参数矩阵Ei、第四状态参数矩阵Er1(t)以及第五状态参数矩阵Er2(t);i=0,1,2,...N;
其中x(t′i1)~x(t′il)分别为t′i1~t′il时刻的系统状态,ti<t′i1<t′i2<…<t′il<ti+1,l是正整数;
Di=[d(t′i1),d(t′i2),...,d(t′il)]T;其中
其中r取值为1~l;x(t′ir)=[x1(t′ir),x2(t′ir),...,xn(t′ir)]T,x1(t′ir),x2(t′ir),...,xn(t′ir)为t′ir时刻系统状态x(t′ir)中的n个状态分量;i=0,1,2,...N;
Ei=[ei1,ei2,...,eil]T;其中其中x1(t′ir+δt)~xn(t′ir+δt)为t′ir+δt时刻系统状态x(t′ir+δt)中的n个状态分量;
Er1(t)=[er1(t,t′i1),er1(t,t′i2),...,er1(t,t′il)]T;其中er1(t,t′ir)为关于t′ir时刻和t时刻的第一误差;r=1,2,...l;
Er2(t)=[er2(t,t′i1),er2(t,t′i2),...,er2(t,t′il)]T;其中er2(t,t′ir)为关于t′ir时刻和t时刻的第二误差;r=1,2,...l;
采用所述状态参数矩阵与式(9)到式(11)结合,获得:
(3Di-2Ei)·css(P(t))=Di·css(P(t+δt))+Ci·cs(Q)·δt-Er1(t)-Er2(t) (12)
和
其中css(*)是对称矩阵*∈Rn×n去除重复元素的列展开;
若3Di-2Ei列满秩,式(13)直接求解:
t∈[ti,ti+1);
步骤2、代价函数对切换时间ti的偏导数为:
由式(1)和式(4)得到:
用克罗内克kronecker积形式表示为:
所述状态参数矩阵还包括第六状态参数矩阵Fj、第七状态参数矩阵Gj以及第八状态参数矩阵h(ti);建立Fj和Gj;j=0,1,2,...N;
Gj=[g(t′j1),g(t′j2),...,g(t′jl)]T;其中
tj<t′j1<t′j2<…<t′jl<tj+1,t′jl+δt′<tj+1;
其中t′,t′+δt∈[tj,tj+1),进而得到:
(Fj-Cj)·cs(P(ti))=2Gj·csa(P(ti)Aj) (16)
csa(*)是矩阵*∈Rn×n的变换,具体变换形式为:
*为矩阵B,bjr是矩阵B第j行第r列的元素;
若Gj列满秩,获得csa(P(ti)Aj)的近似值:
通过式(17)的求解结果估计偏导数如下:
其中第八状态参数矩阵为:
步骤3、采用如下迭代步骤计算最优切换时间:
S1、设置迭代次数k=0,切换时间的初始值为所述切换时间的初始值为随机设定时刻;
S2、获取切换时间并测得所述切换线性系统的状态数据;
S3、取i=1,2,…,N和j=0,1,2,…N,依据步骤2计算状态参数矩阵Di,Ei,Cj,Gj,Fj和h(ti);
S4、分别按照式(14)、(17)和(18)估计和
令
S5、更新切换时间:其中α为预设的步长,α取值在0~1之间;
S6、判断是否成立,若不成立,令k自增1,返回到S2;若成立此时为最优切换时间;
其中ε预设的阈值,其中ε<0.1;
步骤4、根据计算的最优切换时间对所述切换线性系统进行切换控制。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京理工大学,未经北京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810846864.3/1.html,转载请声明来源钻瓜专利网。