[发明专利]一种基于深度强化学习的空间双臂系统约束运动规划方法有效

申请号：	202010830247.1	申请日：	2020-08-18
公开（公告）号：	CN112171660B	公开（公告）日：	2021-11-23
发明（设计）人：	李爽;李胤慷;佘宇琛	申请（专利权）人：	南京航空航天大学
主分类号：	B25J9/16	分类号：	B25J9/16
代理公司：	江苏圣典律师事务所 32237	代理人：	贺翔
地址：	210016 江***	国省代码：	江苏;32
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于深度强化学习空间双臂系统约束运动规划方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明公开了一种基于深度强化学习的空间双臂系统约束运动规划方法，步骤如下：1）利用广义雅可比矩阵建立自由漂浮空间双机械臂系统的运动学模型；2）基于上述的空间双臂系统的运动学模型，结合DDPG算法，设计空间双臂系统运动规划算法；3）对DDPG算法中奖励函数进行设计，以实现对空间双臂系统运动规划算法中各约束条件的满足，包括机械臂末端执行机构的速度约束和双机械臂协同运动的自碰撞约束。本发明提高了运动规划算法的泛用性与安全性。

技术领域

本发明属于空间机械臂运动规划技术领域，具体涉及一种基于深度强化学习的空间双臂系统约束运动规划方法。

背景技术

空间机械臂作为空间操控任务中十分有效的一种执行机构，在修复故障卫星、清除空间碎片、组装大型空间结构等空间操控任务中都具有很高的工程应用价值。由于空间中微重力环境的影响，空间机械臂的运动特性与地面机械臂存在明显的差异，具体体现在地面机械臂一般具有固定的基座，而空间机械臂在执行任务的过程中基座一般都处于自由漂浮的状态。空间双机械臂系统相比于空间单机械臂系统而言在执行操控任务时更加安全可靠，且具有更高的灵活性，空间双臂系统的运动规划技术是研发空间双臂系统的一项关键技术。

目前，针对空间双臂系统的运动规划问题，往往采用遗传算法或粒子群算法等启发式算法进行寻优处理，然而采用启发式算法往往只能针对特定的一组空间机械臂初始构型与目标未知进行点对点的运动规划，而当空间机械臂初始构型或目标抓取点位置发生变化时，则需要从头开始重新进行一次运算，因此该方法的泛用性较差。

发明内容

针对于上述现有技术的不足，本发明的目的在于提供一种基于深度强化学习的空间双臂系统约束运动规划方法，以解决现有技术中传统运动规划方法泛用性差，以及无约束的基于深度强化学习算法的运动规划方法造成的机械臂碰撞损伤等问题。

为达到上述目的，本发明采用的技术方案如下：

本发明的一种基于深度强化学习的空间双臂系统约束运动规划方法，步骤如下：

1)利用广义雅可比矩阵建立自由漂浮空间双机械臂系统的运动学模型；

2)基于上述的空间双臂系统的运动学模型，结合DDPG算法，设计空间双臂系统运动规划算法；

3)对DDPG算法中奖励函数进行设计，以实现对空间双臂系统运动规划算法中各约束条件的满足，包括机械臂末端执行机构的速度约束和双机械臂协同运动的自碰撞约束。

进一步地，所述步骤1)具体包括：根据下式(1)建立空间双机械臂系统的运动学模型：

其中，^Iv₀与^Iω₀分别为空间机械臂基座在惯性参考系下的速度矢量与角速度矢量；与分别为第1个机械臂在惯性参考系下的速度矢量与角速度矢量；与分别为第2个机械臂在惯性参考系下的速度矢量与角速度矢量；和分别为两臂各关节角的角速度；M为空间机械臂系统的质量矩阵，r_0g＝r_g-r₀，r_g表示系统质心位置，r₀表示空间机械臂基座位置，算子×表示斜对称矩阵；J₀和J_φ为机械臂系统分别对关节角和基座的雅可比矩阵，其中：

式中，为第i关节的角速度方向矢量，为第i关节的位置矢量，为第i连杆的质心位置矢量，I为惯性张量矩阵。

进一步地，所述步骤2)具体包括：

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于南京航空航天大学，未经南京航空航天大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202010830247.1/2.html，转载请声明来源钻瓜专利网。

上一篇：一种SF6高压电器用铝合金工件车削加工方法
下一篇：一种面向高校疫情防控的日常位置与行程数据控制方法

同类专利

专利分类

B 作业；运输

B25 手动工具；轻便机动工具；手动器械的手柄；车间设备；机械手
B25J 机械手；装有操纵装置的容器
B25J9-00 程序控制机械手
B25J9-02 .以臂的运动为特征的，例如直角坐标型的
B25J9-06 .以多铰接爪臂为特征的
B25J9-08 .以部件结构为特征的
B25J9-10 .以机械手元件定位装置为特征的
B25J9-16 .程序控制

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于深度强化学习的空间双臂系统约束运动规划方法有效

专利文献下载