[发明专利]一种基于动态控制器的迭代学习控制方法有效
申请号: | 201910763196.2 | 申请日: | 2019-08-19 |
公开(公告)号: | CN110376901B | 公开(公告)日: | 2022-09-02 |
发明(设计)人: | 常明方;吴爱国 | 申请(专利权)人: | 哈尔滨工业大学(深圳) |
主分类号: | G05B13/04 | 分类号: | G05B13/04 |
代理公司: | 深圳市添源创鑫知识产权代理有限公司 44855 | 代理人: | 覃迎峰 |
地址: | 518000 广东省深圳市南*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 动态 控制器 学习 控制 方法 | ||
1.一种基于动态控制器的迭代学习控制方法,其特征在于,包括依次执行以下步骤:
步骤1:建立非线性差分系统的动态线性化模型,在这个模型的基础上设计迭代学习控制器,并给出控制器动态增益的更新法则;
步骤2:在系统动态线性化模型的基础上给出其伪梯度PG的估计值表达式;
步骤3:从伪梯度PG的估计表达式当中提取伪偏导数PPD的估计值来代替控制器动态增益更新法则中真实值,设计迭代学习控制方案;
所述步骤3中,实际运行的控制器动态增益的更新法则和迭代学习控制方案如下:
第一步骤,实际运行的控制器增益更新法则:
由于无法求得更新法则公式(10),(11)和(12)中的PPD的真实值为保证动态控制器增益更新程序能够运行,提取步骤2中PG估计值中的PPD估计值来代替更新法则中的可得控制增益的更新法则如下:
第二步骤,迭代学习控制方案,包括执行以下步骤:
步骤S1:选取受控系统的输入输出数据长度Lu和Ly的值,这样就可以得到系统的动态线性化数据模型和控制器表达式;
步骤S2:对控制过程中的初值和参数进行设定;给定系统的初始输入u1(t),t∈I[1,T]的值;给出动态参数t∈I[1,T]的值;同时选择步长因子和学习因子μ,μe,μy,j,j=1,2,…,Ly,μu,k,k=1,2,…,Lu-1的值;设置受控系统的初始值即对于i∈I[1,+∞),每次运行时在t=1时刻均有yi(1)=yd(1);
步骤S3:为了使系统能够接近期望轨迹,需要对运动过程当中的参数i∈I[1,+∞),t∈I[1,T]值进行数值限制;
步骤S4:根据初值和参数值的设置使受控系统按照如下顺序运行:
步骤S5:重复执行步骤S1至步骤S4的操作,直到所述迭代学习控制方法取得良好的控制效果。
2.根据权利要求1所述的迭代学习控制方法,其特征在于,所述步骤1中,系统的动态线性化和动态控制器设计如下:
第一步骤,受控系统的数学模型:
假设所要进行迭代学习控制的受控系统具有如下非线性差分方程模型:
yi(t+1)=f(yi(t),yi(t-1),…,yi(t-ny),ui(t),ui(t-1),…,ui(t-nu)) (1)
其中,ui(t)和yi(t)分别是第i次迭代和第t个采样时刻的输入和输出信号;i∈I[1,+∞),t∈I[1,T];nu,ny是两个未知的正整数;f(…)是未知非线性标量函数;
定义是由一个在长度为Ly的输入数据窗口[yi(t) yi(t-1)…yi(t-Ly+1)]T和一个长度为Lu的输出数据窗口[ui(t) ui(t-1)…ui(t-Lu+1)]T组成的信号向量,其中整数Ly,Lu(0≤Ly≤ny,0≤Lu≤nu)称为系统的伪阶数,特别地,当t≤0时有
对于公式(1)的SISO非线性系统,在提出其全格式动态线性化模型之前,以下两个假设是必需的:
假设1 f(…)关于(它所包含的输入输出)各个变量的偏导数是连续的;
假设2系统沿着迭代轴方向满足Lipschitz条件,即对于t∈I[1,T],i∈I[1,+∞),若则下式成立
其中,Δyi(t+1)=yi(t+1)-yi-1(t+1),b>0是个常数;
第二步骤,对受控系统的数学模型进行动态线性化:
对于受控系统(1),如果假设1和假设2成立,则系统可以转化为如下动态线性化形式:
其中,PG
是一个时变参数向量,且满足数据向量:
第三步骤,动态控制器的设计:
受控系统(1)能够写成公式(3)所示的动态线性化形式,对关系式(3)展开可得
由关系式(4)可知,误差
其中yd(t+1)是期望轨迹;
当系统在第i次迭代第t+1时刻达到期望的轨迹时,这里有ei(t+1)=0,也就是
假设伪偏导数此时通过关系式(6)可以求得理想控制器的表达式如下:
设定
那么理想控制器(7)的表达式能够写成:
由此,实际当中控制器的表达式能够写成:
其中分别为ψi,e(t),ψi,y,j(t),j=1,2,…,Ly,ψi,u,k(t),k=1,2,…,Lu-1的估计值;
第四步骤,求取控制器增益的更新法则:
引入能量函数根据梯度下降法求得控制器增益的更新法则为:
其中μe,μy,j,j=1,2,…,Ly,μu,j,k=1,2,…,Lu-1为学习因子。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工业大学(深圳),未经哈尔滨工业大学(深圳)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910763196.2/1.html,转载请声明来源钻瓜专利网。