[发明专利]一种面向未知环境约束的可重构机械臂控制方法及系统有效
申请号: | 202110447459.6 | 申请日: | 2021-04-25 |
公开(公告)号: | CN113103237B | 公开(公告)日: | 2022-10-04 |
发明(设计)人: | 马冰;董博;张振国;安天骄;卢曾鹏 | 申请(专利权)人: | 长春工业大学 |
主分类号: | B25J9/16 | 分类号: | B25J9/16 |
代理公司: | 北京方圆嘉禾知识产权代理有限公司 11385 | 代理人: | 冯静 |
地址: | 130012 吉林*** | 国省代码: | 吉林;22 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 面向 未知 环境 约束 可重构 机械 控制 方法 系统 | ||
1.一种面向未知环境约束的可重构机械臂控制方法,其特征在于,包括:
构建约束空间下多自由度的可重构机械臂的动力学模型;
基于所述动力学模型,采用自适应估计参数法建立所述可重构机械臂的状态空间方程;
基于所述状态空间方程,采用多信息融合函数构建性能指标函数和哈密尔顿-雅可比-贝尔曼函数;
采用自适应动态规划算法,通过神经网络评价模型对所述性能指标函数进行估计,得到性能指标估计函数,并基于所述性能指标估计函数,采用策略迭代算法对所述哈密尔顿-雅可比-贝尔曼函数进行求解,得到近似的最优力和位置跟踪控制策略;所述近似的最优力和位置跟踪控制策略为所述哈密尔顿-雅可比-贝尔曼函数最小时对应的力和位置跟踪控制策略;
所述基于所述动力学模型,采用自适应估计参数法建立所述可重构机械臂的状态空间方程,具体包括:
将受未知环境约束的可重构机械臂的未知约束方程线性参数化,得到线性表示形式;
由所述线性表示形式确定反映约束环境空间与任务工作空间关系的雅可比矩阵;
对所述反映约束环境空间与任务工作空间关系的雅可比矩阵进行估计,得到估计矩阵;
基于所述估计矩阵确定可重构机械臂的末端效应器与约束环境接触所产生的接触力矩估计值;
由所述动力学模型和所述接触力矩估计值构建所述可重构机械臂的状态空间方程;
所述基于所述状态空间方程,采用多信息融合函数构建性能指标函数和哈密尔顿-雅可比-贝尔曼函数,具体包括:
基于所述状态空间方程,构建包含末端效应器的跟踪误差和接触力偏差的多信息融合函数;所述多信息融合函数为
其中,m(t)为t时刻的多信息融合函数,eq为关节位置跟踪误差,为关节速度跟踪误差,eτ为末端效应器约束力矩跟踪误差,kdeq为的系数,keq为的系数,kτ为eτ的系数;
由所述多信息融合函数构建性能指标函数和哈密尔顿-雅可比-贝尔曼函数;
所述性能指标函数为
其中,P(m(t))为t时刻的性能指标函数,Ψ(Ω)为由一系列可行的控制策略组成的集合,u为控制输入力矩,N(m(t),u(m(t)))为t时刻的效用函数,u(m(t))为t时刻的多信息融合函数对应的力和位置跟踪控制策略;
所述哈密尔顿-雅可比-贝尔曼函数为
其中,为哈密尔顿-雅可比-贝尔曼函数,m为多信息融合函数,u(m)为多信息融合函数对应的力和位置跟踪控制策略,为性能指标函数P(m)对m的偏微分函数,N(m,u(m))为效用函数,为多信息融合函数的一阶导数,为t时刻的性能指标函数P(m(t))对m(t)的偏微分函数,为估计接触力矩,vc为与力和位置跟踪误差相关的函数,Qc为多信息融合函数对应的给定的正定矩阵,Rc为力和位置跟踪控制策略对应的给定的正定矩阵,n为可重构机械臂的自由度,为n×n维的空间,表示与可重构机械臂系统惯性项、离心力-哥氏力项和重力项相关的非线性函数,g(q)表示为与重力项相关的模型函数,q为关节位置向量,为关节速度向量;
采用自适应动态规划算法,通过神经网络评价模型对所述性能指标函数进行估计,得到性能指标估计函数,并基于所述性能指标估计函数,采用策略迭代算法对所述哈密尔顿-雅可比-贝尔曼函数进行求解,得到近似的最优力和位置跟踪控制策略,具体包括:
(1)利用策略迭代算法求解哈密尔顿方程得到最优性能指标函数,然后将解结合策略迭代算法得到最优控制策略,步骤如下:
步骤1:参数初始化,选择i为迭代次数,当i=0时,给定一个初始的容许控制μ(0)(m),并选取一个正常数δ;
步骤2:当i>0时,结合控制策略μ(i)(m),通过以下的等式来更新性能指标函数P(i)(m),
这里性能指标函数P(i+1)(m)=0,为P(i+1)(m)对m的偏微分函数;
步骤3:通过以下等式来更新控制策略μ(i)(m),
步骤4:如果||P(i+1)(m)-P(i)(m)||≤δ,停止计算,得到最优控制策略;否则,令i=i+1,转到步骤2;
步骤5:停止;
所述近似的最优力和位置跟踪控制策略为
其中,为近似的最优力和位置跟踪控制策略,为力和位置跟踪控制策略对应的给定的正定矩阵,gT(q)为与惯性矩阵相关的模型函数,为神经网络评价模型中激活函数的偏导数,为神经网络评价模型中权值的估计值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于长春工业大学,未经长春工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110447459.6/1.html,转载请声明来源钻瓜专利网。