[发明专利]一种倒立摆自适应迭代学习反演控制方法有效
申请号: | 201910328490.0 | 申请日: | 2019-04-23 |
公开(公告)号: | CN110134011B | 公开(公告)日: | 2022-01-11 |
发明(设计)人: | 陈强;施卉辉;陈凯杰;孙明轩 | 申请(专利权)人: | 浙江工业大学 |
主分类号: | G05B13/04 | 分类号: | G05B13/04 |
代理公司: | 杭州斯可睿专利事务所有限公司 33241 | 代理人: | 王利强 |
地址: | 310014 浙江省*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 倒立 自适应 学习 反演 控制 方法 | ||
1.一种倒立摆自适应迭代学习反演控制方法,其特征在于,所述控制方法包括以下步骤:
步骤1,建立倒立摆的动态模型,初始化系统状态、采样时间以及控制参数,过程如下:
1.1倒立摆的动态模型表达形式为:
其中x1,k,x2,k分别是角度位置和角速度,k是迭代次数;分别是角度位置和角速度的一阶导数;g是重力加速度;mc,m是分别是小车和倒立摆的质量;l是倒立摆长度的一半;uk表示控制输入,sat(uk)表示受饱和限制的控制输入,其表达形式为:
其中um是uk的最大值,|uk|表示uk的绝对值,sgn(uk)表示uk的符号函数;
1.2定义未知函数f(xk)和b(xk),将式(1)写成以下形式:
其中是未知的光滑函数;xk=[x1,k,x2,k]T;从b(xk)的表达式中得到b(xk)>0;
步骤2,逼近和估计输入饱和项,其过程如下:
采用以下的双曲正切函数逼近输入饱和函数:
其中tanh(·)表示双曲正切函数,e(·)表示以自然常数e为底的指数函数;
由此得
sat(uk)=g(uk)+d(uk) (5)
其中d(uk)是一个有界函数,满足
|d(uk)|=|sat(uk)-g(uk)|≤um(1-tanh(1))=D (6)
其中D是一个未知正数,|d(uk)|表示d(uk)的绝对值;
通过微分中值定理计算,得出
其中uξ=ξuk+(1-ξ)u0,u0∈[0,uk];0<ξ<1是一个常数;是uk=uξ时对g(uk)的偏导,取u0=0,g(u0)=0;则公式(7)写为:
将公式(8)代入到公式(5)中,得
步骤3,计算系统跟踪误差,其过程如下:
定义系统跟踪误差z1,k如下:
z1,k=x1,k-xd (10)
其中xd是给定的光滑有界的参考轨迹;
对公式(10)求导得到:
其中是系统跟踪误差的一阶导数,是参考轨迹的一阶导数;
步骤4,定义误差变量,设计虚拟控制器,其过程如下:
4.1定义误差变量z2,k为:
z2,k=x2,k-α1,k (12)
其中,α1,k是设计控制器过程中的虚拟控制器;系统初始条件为:z1,k(0)=0,z2,k(0)=0;
对式(12)进行求导,得到:
其中是误差变量的一阶导数,是设计控制器过程中虚拟控制器的一阶导数;
将式(3),式(9)代入式(11)和式(13)中,得到:
由此,计算:
其中
由于0<guξ≤1,则必定存在一个正的常数gN使得成立;然后,得出是有界的,并且
其中表示的绝对值,ρD是一个大于零的常数;
4.2为逼近函数设计以下神经网络:
定义W*为神经网络理想权重矩阵,则写成以下形式:
其中W*T=W*,是神经网络的输入向量,是参考轨迹的二次导数,εk是神经网络的逼近误差且满足|εk|≤σN,|εk|表示εk的绝对值,σN是|εk|的上界,是一个正的常数,Φ(Xk)=[φ1(Xk),φ2(Xk),…,φm(Xk)]T是神经网络的基函数,m为神经元的个数,φi(Xk)的形式如下所示:
其中ιi和υi分别是高斯函数的中心和宽度,i=1,…,m,其中exp(·)是指数函数;
4.3设计神经网络权值和估计误差更新律:
其中γ1,γ2,β1,β2都是合适的参数,分别表示在第k和k-1次迭代时对W*和σN的估计,是和的一阶导数,δ是一个正的常数;给定
4.4设计虚拟控制器和实际控制器,如下所示:
其中c1,c2是正常数,
4.5把式(18),式(22)和式(23)代入到式(15)和式(16)中,得:
其中
步骤5,构造李雅普诺夫函数Vk(t)与类李雅普诺夫函数Ek(t),分析系统性能,其过程如下所示:
其中
对Vk(t)求导,并将式(24),(25)代入,得到:
其中和分别是和的一阶导数;
将(17)代入(28),得到:
其中|z2,k|表示z2,k的绝对值;
然后,写为:
其中
将(20),(21)代入(30),得:
采用双曲正切函数的以下性质:
0≤|z2,k|-z2,ktanh(z2,k/δ)≤0.2785δ; (32)
将式(32)代入(31),得到:
对式(27)求导,得到:
在初始迭代k=0时,和则由此得到:
对式(35)两侧同时进行积分运算,得到:
可以看出在[0,T]中是有界的;在初始条件的选择下,V0(0)也是有界的;得出E0(t)是有界的,即
Ek(t)在第k次迭代的差分形式为:
其中Vk-1(t)和Ek-1(t)分别是第k-1次的李雅普诺夫函数和类李雅普诺夫函数;
将式(33)代入(38)中,得到
结合得到:
其中T表示倒立摆系统的迭代周期;cm=min{c1,c2}表示取c1,c2的最小值;表示一个正的常数;zr,k,r=1,2表示系统跟踪误差和误差变量的总称;
对ΔEk(T)有限迭代次数的累加得到:
其中Ek(T)表示第k次迭代,t=T时的类李雅普诺夫函数;E0(T)表示k=0,t=T时的类李雅普诺夫函数;
将(40)代入到(41),写成:
从(42)得出:
其中表示zr,k,r=1,2的二范数形式;
则判定对于任意给定常数都存在一个正的有限迭代次数k0,对于k>k0,使得成立;也就是说,系统跟踪误差z1,k在二范数的意义上在有限迭代次数内收敛到零附近的领域内。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910328490.0/1.html,转载请声明来源钻瓜专利网。