[发明专利]一种基于策略迭代的伺服电机自适应智能控制方法在审
申请号: | 202110142255.1 | 申请日: | 2021-02-02 |
公开(公告)号: | CN112987564A | 公开(公告)日: | 2021-06-18 |
发明(设计)人: | 朱俊威;夏振浩;王波;顾曹源;吴麒;张文安 | 申请(专利权)人: | 浙江工业大学 |
主分类号: | G05B13/04 | 分类号: | G05B13/04 |
代理公司: | 杭州斯可睿专利事务所有限公司 33241 | 代理人: | 王利强 |
地址: | 310014 浙江省*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 策略 伺服 电机 自适应 智能 控制 方法 | ||
1.一种基于策略迭代的伺服电机自适应智能控制方法,其特征在于,所述方法包括以下步骤:
步骤1),对伺服电机进行模型辨识,确定系统传递函数,伺服电机的系统模型仅用于在仿真时获取伺服电机下一时刻的位置和速度信息:
通过辨识系统,得到了伺服电机的传递函数如式(1)所示:
其中G(s)为伺服电机的传递函数,Ks、Ts为辨识出来的参数;
步骤2),建立运动控制系统状态空间方程并离散化,过程如下:
在步骤1)的基础上将其转化为状态空间方程,如式(2):
其中
将上述的状态空间方程离散化,如式(3):
其中A为系统的状态矩阵,B为输入矩阵,x表示系统状态量,u为系统输入;
步骤3),从伺服电机中采集当前电机的位置和速度,并计算当前时刻电机位置和速度相比上一时刻的增量以及系统在当前时刻的损失函数,最后通过最小二乘法计算当前状态下的最优的权值矩阵P,过程如下:
设计新的策略迭代方法:在(A,B)稳定的假设下,令K是(2)式的一个稳定性反馈增益,因此是一个稳定的闭环系统,那么对应的无界系统的二次损失函数表示为
其中P是李雅普诺夫方程的一个实对称正定解,Q和是R是正定参数,
(A-BK)TP+P(A-BK)=-(KTRK+Q)
V(x(t))作为(1)式系统状态方程带有反馈控制K的李雅普诺夫函数,因此损失函数表示为
基于上式(6),用xt来表示x(t)对价值函数进行参数化并考虑初始的稳定控制增益是K0,在线实施以下策略迭代方案:
Ki+1=R-1BTPi (8)
上式(7)、(8)制定了新的迭代策略,并且在迭代过程中不需要涉及系统矩阵A;
步骤4),寻找损失函数最小的参数P矩阵以及相关联的控制策略Ki
步骤5),判断状态的增量是否小于ε,若不满足条件则继续更新策略K进行状态反馈,过程如下:
系统中存在一个评价函数用来计算伺服电机当前位置和速度与上一时刻位置和速度之间的差值,当差值小于设定的阈值时,系统的控制策略将不再更新,反之则继续更新策略K。
2.如权利要求1所述的一种基于策略迭代的伺服电机自适应智能控制方法,其特征在于,所述步骤4)的过程为:
4.1)将系统价值函数表示为向量乘积的形式,过程如下:
将系统的价值函数xT(t)Pix(t)表示为的形式,其中表示Kronecker积二次多项式的基向量,向量中元素为{xi(t)xj(t)}i=1,n;j=i,n,其中v(.)是作用于对称矩阵的向量值矩阵函数,通过堆叠对称矩阵对角线和上三角部分的元素返回列向量,其中非对角线元素取为2Pij;
4.2)计算系统的价值函数在时间[t,t+T]上的积分:
式(7)表示为
在这个方程中,是一个未知参数的向量,作为回归向量,将右侧的目标函数记作也就是系统的价值函数在[t,t+T]上的积分;
是通过系统状态在时间[t,t+T]上的积分得到的;
4.3)通过最小二乘法来计算最优的Pi的矩阵使得系统的值函数最小:
首先沿着系统的单一状态轨迹采集到足够的位置和速度信息,对这些位置和速度信息进行处理后得到系统的值函数以及回归向量则可使用最小二乘法计算出使当前时刻值函数最小的参数向量然后从参数向量计算出的参数矩阵P,从而根据式(8)计算出新的控制策略Ki+1,使系统值函数最小的参数向量可以通过最小二乘法获得,计算过程如下:
其中,
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110142255.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种CNC加工设备
- 下一篇:一种合成双苯恶唑酸中间体氯代肟基乙酸乙酯的方法