[发明专利]一种事件触发机制的模块化机器人分散力/位置最优控制方法在审
申请号: | 202211579166.4 | 申请日: | 2022-12-08 |
公开(公告)号: | CN115857353A | 公开(公告)日: | 2023-03-28 |
发明(设计)人: | 石建军;卢曾鹏;李岩;程国醒;苗立晓;毕加彬 | 申请(专利权)人: | 深圳市华成工业控制股份有限公司 |
主分类号: | G05B13/04 | 分类号: | G05B13/04 |
代理公司: | 深圳卓启知识产权代理有限公司 44729 | 代理人: | 董慧婷 |
地址: | 518100 广东省深圳市宝*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 事件 触发 机制 模块化 机器人 分散力 位置 最优 控制 方法 | ||
1.一种事件触发机制的模块化机器人分散力/位置最优控制方法,其特征在于,该方法首先构建受环境约束下模块化机器人关节动力学模型描述方程及转换的状态空间方程;其次采用多元信息融合函数构建性能指标函数和哈密尔顿-雅可比-贝尔曼函数;然后设计一种合理的事件触发决策机制,在满足事件触发条件时,系统满足李雅普诺夫渐进稳定;接下来利用评判神经网络估计性能指标函数,采用策略迭代算法对哈密尔顿-雅可比-贝尔曼函数进行求解,最后,得到基于事件触发决策机制的最优力/位置跟踪控制策略。
该方法包括如下步骤:
步骤一,构建受环境约束下模块化机器人关节动力学模型描述方程及转换的状态空间方程:
针对模块化机器人系统的第i个子关节系统建立动力学模型:
其中,右下角标注“i”代表第i个关节;qi,代表关节的角度、速度、加速度量;Imi代表电机转动惯量;γi代表减速比;τi代表控制输入;JΦ(qi)代表雅可比矩阵;fie代表末端执行器接触力;Fqi(qi,qi)代表摩擦的非参数项;τid代表外部干扰;δi代表交联耦合项;分别代表粘性摩擦、库仑摩擦、静摩擦,Stribeck相关参数估计值;不确定参数向量/表示/代表不确定参数矩阵;sat(qi)表示饱和函数。
仅在关节角度可测的情况下,使得模块化机器人系统达到期望状态。将系统状态定义为获得转换后的状态空间表达形式:
其中,右下角标注“i”代表第i个关节;xi1表示关节角度状态;xi2表示关节速度状态;Λi=(Imiγi)-1代表机械装置物理系数;代表模块化机器人关节动力学模型集成不确定项,包括摩擦非线性和近似误差,以及耦合交联项;代表模块化机器人关节动力学模型已知项。代表外部输入未知信息项;
步骤二,采用多元信息融合函数构建性能指标函数和哈密尔顿-雅可比-贝尔曼函数:
根据所述模块化机器人状态空间方程,构建多元信息融合函数为:
其中,右下角标注“i”代表第i个关节;si代表多元信息融合函数;eqi代表跟踪误差;eqi代表速度误差;eτi代表约束力矩跟踪误差:kqi,kτ均代表多元信息融合函数的控制增益。
根据所述多元信息融合函数构建最优性能指标函数:
其中,si(t)代表融合误差函数;初始值s0(t)=s(0);Υi(si(t),uei(si(t)))代表t时刻的融合力/位置误差的效应函数,给定初始值Υi(0,0)=0,且Υi(si(t),uei(si(t)))≥0;Γi代表模型不确定项上界;Gi代表模型已知项;κi代表增益系数;θi代表外部输入未知信息项上界;Ψi(Ωe)代表可行的控制策略,Ωe代表控制策略集合。
根据所构建的性能指标函数,如果存在且连续可微,局部李雅普诺夫方程:
其中,代表性能指标函数Zi(si)对si的偏导数/vi代表期望加速度,实际速度以及约束力矩误差的相关函数表达式,/矩阵Qa和Ra为正定矩阵;
结合贝尔曼优化策略,最优性能指标函数满足哈密尔顿方程:
得到模块化机器人系统的最优力/位置控制律为:
其中,代表最优力/位置控制策略;/代表力/位置跟踪控制策略对应的给定的正定矩阵;/代表与惯性矩阵相关的模型函数。
步骤三,设计一种合理的事件触发决策机制:
设计事件触发决策机制:
其中,代表事件触发决策机制采样状态;定义间隔函数Eei(t),以获得合理的事件触发条件;tl代表上一个采样时刻;tl+1代表即将切换的控制时刻;/代表事件触决策机制的最优控制策略。
根据所述事件触发决策机制的最优控制律以及所述的哈密尔顿方程,得到事件触发决策机制下最优问题的哈密尔顿方程:
针对辅助变量状态si,存在所设计的跟踪控制律是利普希茨连续的,且存在一个正常数/满足以下不等式:
结合贝尔曼最优原理,最优性能指标函数满足哈密尔顿方程:
步骤四,设计基于事件触发决策机制的最优力/位置跟踪控制策略:
基于神经网络的逼近性能,通过评判神经网络逼近最优性能指标函数:
其中,表示神经网络理想权值;σiz(si)表示激活函数;εiz(si)表示残余误差。基于事件触发决策机制的评判神经网络逼近最优性能指标函数相对于si相应状态的梯度:
其中,分别为性能指标函数,激活函数以及残余误差的偏导数。神经网络理想权值/无法提前预知,因此,将局部评价神经网络逼近:
其中,表示神经网络近似权值;从而,得到事件触发机制的模块化机器人力/位置控制策略:
推导得到基于事件触发机制的哈密尔顿函数表示为:
其中,eich是近似的事件触发哈密尔顿函数的估计残差。
设计更新策略机制:
/
其中,αei是评判神经网络权值更新策略。
事实上,近似的事件触发哈密尔顿函数的估计残差eich等于零或在零附近的较小邻域。为了达到理想逼近效果,即eich=0。利用多目标黄金搜索策略优化基于RBF的评判神经网络权值,使得估计残差eich趋近到零,定义如下适应度函数:
fnes=exp(||eich||)
步长更新迭代:
Sti(t+1)=T.Sti(t)+C1.cos(r1).(pipb(t)-Wiz(t))+C2.sin(r2).(pipgb(t)-Wiz(t))
其中,Sti表示搜索策略的更新步长;C1,C2是[0,2]之间的随机数,r1,r2表示(0,1)之间的随机数;pipb表示局部最优位置;pipgb表示全局最优位置;T表示搜索策略的变换算子,即tmax表示最大迭代次数;Wizp(t)表示权值位置。
评判神经网络权值位置Wizp(t)的迭代策略:
Wizp(t+1)=Wizp(t)+Sti(t+1)
据李雅普诺夫稳定性定理和事件触发决策机制,针对n自由度的模块化机器人关节模块子系统设计了能使系统稳定的事件触发条件即:
其中,λmin(Qa),λmax(Qa)分别表示最小特征值和最大特征值;Eetif为事件触发条件。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市华成工业控制股份有限公司,未经深圳市华成工业控制股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211579166.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:显示面板及显示装置
- 下一篇:用于实现碳金融交易的智能监督方法及装置