[发明专利]一种基于最优导纳参数的自适应人机协作控制方法有效

申请号：	202110543512.2	申请日：	2021-05-19
公开（公告）号：	CN113352322B	公开（公告）日：	2022-10-04
发明（设计）人：	禹鑫燚;杨吴斌;吴加鑫;欧林林;罗惠珍;史栓武	申请（专利权）人：	浙江工业大学
主分类号：	B25J9/16	分类号：	B25J9/16
代理公司：	杭州天正专利事务所有限公司 33201	代理人：	王兵
地址：	310014 浙***	国省代码：	浙江;33
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于最优导纳参数自适应人机协作控制方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于最优导纳参数的自适应人机协作控制方法，具体步骤如下：

步骤1：描述具有HRC任务的机器人动力学模型和用于机器人导纳控制的机器人导纳模型；

机器人动力学模型为：

其中q，分别为关节角、速度和加速度矢量；x,分别为末端执行器位置、速度和加速度矢量；M(q)∈R^p×p为对称惯性矩阵，为科氏力和向心力的矢量，G(q)∈R^p表示重力矢量，J(q)∈R^n×p为雅可比矩阵，τ∈R^p为机器人控制输入力矩，f_h∈Rⁿ为由操作者产生的相互作用力，G_h∈Rⁿ表示人的输入力增益，κ(·)为逆运动学的解，p为机器人关节的数量，n表示笛卡尔空间中的维数；

机器人导纳模型描述为：

其中x_m是期望参考轨迹，即机器人导纳模型和x_d的输出是预定的任务轨迹，M_d，B_d和K_d分别代表期望的惯性、阻尼和刚度系数；是系统辅助力，对应于x_m和x_d的关节坐标可以表示为q_m和q_d；

步骤2：设计基于BLF的机器人自适应约束控制器的内环；

内环设计的目的是使机器人的行为跟踪规定的机器人导纳模型的输出，并保持在一个安全工作空间内；不需要任务信息，只需关注于最小化规定的机器人导纳模型输出与机器人实际运动之间的跟踪误差；具体步骤如下：

步骤2-1：将节点约束设为|q|＜k_l，其中k_l＝[k_l1,...,k_lp]为约束边界；取q₁＝q，机器人动力学(1)可以表示为：

定义跟踪误差e₁＝q₁-q_m，e₂＝q₂-α，其中，

其中，k_i(i＝1,…,p)是正常数，代表跟踪误差的约束条件，其中是由q_m的最大绝对值组成的向量；对e₂相对于时间求微分：

步骤2-2：构造一个log型BLF候选V₁，如下所示：

对V₁相对于时间求微分得到：

步骤2-3：设计另一个BLF候选V₂：

对V₂相对于时间求微分得到：

根据摩尔-彭罗斯伪逆性质可以得到：

当e₂＝[0 0...0]^T时，等式(11)满足因此系统渐进稳定；然而，e₂＝[0 0...0]^T的情况在实际中几乎是不可能的；

步骤2-4：对于其他情况，设计基于模型的控制器如下：

其中，代表的伪逆，K₂是满足的增益矩阵；将(13)代入(11)得到

可见控制器(13)可以使系统稳定；另外，根据BLF的性质，误差e_1i满足-k_bi＜e_1i＜k_bi；因此，关节状态保持在区间|q_1i|＜k_li；

步骤2-5：将控制器(13)改写为：

由于在实际应用中，公式(1)中机器人模型总是未知的；考虑到神经网络可以逼近任何未知的连续函数，故将控制器改为公式(15)；其中是神经网络的输入，S(·)表示径向基函数，是估计的神经网络权重，l是神经网络节点数量，表示理想的W^*TS(Z)的近似；和W^*TS(Z)之间的关系由下给出：

其中W^*表示理想的神经网络权重，ε(Z)是近似误差；设计神经网络权值的更新规则为：

其中表示的第i列，是常值增益矩阵，σ_i是提高系统鲁棒性的一个小的正常数；

步骤2-6：给出候选BLF的V₃为：

其中对V₃相对时间微分并结合等式(14)-(16)，可以得到：

进一步根据(11)的性质，得到：

其中，

λ_min(·)和λ_max(·)分别表示矩阵的极小特征值和极大特征值；所有误差信号都是半全局一致最终有界；

步骤3：设计基于积分强化学习的任务优化的外环：

在外环设计中，对导纳模型的参数进行优化，以使任务跟踪误差和交互力最小；将导纳参数优化问题转化为LQR问题，在不考虑系统模型的情况下，采用积分强化学习的方法求解；系统辅助力的设计具体步骤如下：

步骤3-1：设计系统辅助力：

当手臂执行简单任务时，定义人手臂阻抗模型为(K_us+K_p)f_h＝k_ee_d, (22)

其中K_u，K_p，k_e表示不同操作者和任务的位置矩阵，e_d为跟踪误差，定义为

e_d＝x_d-x_m, (23)

让其中x_d和x_m分别表示特定任务轨迹和期望轨迹，式(22)可以写成：

将导纳模型(3)改写为如下状态空间方程：

其中

从式(28)，可以得到：

为了设计辅助力，假设系统是稳定的，即x_m→x_d；因此可以得到：

步骤3-2：设计最优控制器：

将HRC系统的性能函数定义为该系统的状态空间模型

其中Q＝diag(Q_d,Q_h)，R＝R^T＞0；将性能函数优化问题转化为LQR问题，最优控制器设计为

其中P是代数黎卡提方程的解；

PA+A^TP-PBR^-1B^TP+Q＝0, (35)

矩阵R^-1B^TP包含了机器人导纳模型的参数和人的增益G_h；结合方程(27)和(34)可以得到

通过求解式(36)，可以得到最优导纳参数；

步骤4：利用积分强化学习求解LQR问题：

由于系统矩阵A和B中存在未知参数，采用一种基于值迭代的积分强化学习算法来估计最优控制器；导纳参数优化的具体算法如下：

步骤4-1：从允许控制策略u＝K_kX+e开始，其中K_k包含初始导纳参数，e为探索噪声，选择设置迭代参数k,q为0；

步骤4-2：在时间间隔t∈[t_h-1,t_h]，h＝1,2,...内收集系统状态；

步骤4-3：收集到足够的系统状态后，用下面的贝尔曼方程求解H_k和K_k：

其中H_k＝A^TP_k+P_kA

步骤4-4：更新为其中∈_k是步长；

步骤4-5：如果则将P_k+1更新为P₀，q更新为q+1，k更新为k+1，执行第3步，其中B_q是有界的非空集合；

步骤4-6：如果其中ε是一个小的常数，使用u^*＝-K_kX作为估计的最优策略；然后求解得到估计的最优导纳参数c；否则，将P_k+1更新为k更新为k+1，执行步骤3。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于浙江工业大学，未经浙江工业大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202110543512.2/1.html，转载请声明来源钻瓜专利网。

上一篇：档位式伸缩的支撑腿及儿童安全座椅
下一篇：一种相干被动MIMO雷达克拉美罗界的计算方法

同类专利

专利分类

B 作业；运输

B25 手动工具；轻便机动工具；手动器械的手柄；车间设备；机械手
B25J 机械手；装有操纵装置的容器
B25J9-00 程序控制机械手
B25J9-02 .以臂的运动为特征的，例如直角坐标型的
B25J9-06 .以多铰接爪臂为特征的
B25J9-08 .以部件结构为特征的
B25J9-10 .以机械手元件定位装置为特征的
B25J9-16 .程序控制

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于最优导纳参数的自适应人机协作控制方法有效

专利文献下载