[发明专利]柔性机器人末端抵达控制方法、电子设备和存储介质在审
申请号: | 202010635603.4 | 申请日: | 2020-07-03 |
公开(公告)号: | CN111783250A | 公开(公告)日: | 2020-10-16 |
发明(设计)人: | 孙俊;武海雷;韩飞;孙玥;刘超镇;阳光 | 申请(专利权)人: | 上海航天控制技术研究所 |
主分类号: | G06F30/17 | 分类号: | G06F30/17;G06F30/27;G06N3/04;B25J9/16 |
代理公司: | 上海元好知识产权代理有限公司 31323 | 代理人: | 章丽娟;周乃鑫 |
地址: | 201109 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 柔性 机器人 末端 抵达 控制 方法 电子设备 存储 介质 | ||
本发明公开了一种柔性机器人末端抵达控制方法、电子设备和存储介质,所述方法包括:建立柔性机器人的动力学模型;根据所述动力学模型建立深度神经网络,所述深度神经网络用于拟合所述动力学模型;对所述深度神经网络进行第一次柔性机器人末端抵达过程的初步训练,得到所述深度神经网络的初始参数;对所述深度神经网络进行第二次柔性机器人抵达过程的初步训练,得到所述深度神经网络的最终参数。本发明降低了柔性机器人的动力学模型的不确定性或外部扰动对控制系统的影响,提高了柔性机器人的末端控制精度。
技术领域
本发明涉及人工智能技术领域,特别涉及一种基于深度强化学习的柔性机器人末端抵达控制方法、电子设备和存储介质。
背景技术
基于线缆变长度驱动的柔性机器人控制目标是在避免和周围环境碰撞的条件下,实现柔性机器人末端的精确抵达。柔性机器人末端安全抵达控制过程中,会存在以下问题:一是由于柔性机器人由于其控制系统的复杂性、强非线性、时变和不确定性等特点,难以建立精确的动力学建模;二是柔性机器人运动过程中,线缆与卷盘和圆盘之间会存在摩擦等外界扰动。因此基于模型完全已知的经典反馈控制方法难以有效抑制控制系统模型不确定和外界干扰带来柔性机器人轨迹跟踪控制不精确的问题,甚至导致控制系统不稳定。
发明内容
本发明的目的在于提供一种基于深度强化学习的柔性机器人末端抵达控制方法、电子设备和存储介质,实现降低柔性机器人的动力学模型的不确定性或外部扰动对控制系统的影响,提高柔性机器人的末端控制精度的目的。
为了实现以上目的,本发明通过以下技术方案实现:
一种柔性机器人末端抵达控制方法,包括:
步骤S1、建立柔性机器人的动力学模型;
步骤S2、根据所述动力学模型建立深度神经网络,所述深度神经网络用于拟合所述动力学模型;
步骤S3、对所述深度神经网络进行第一次柔性机器人末端抵达过程的初步训练,得到所述深度神经网络的初始参数;
步骤S4、对所述深度神经网络进行第二次柔性机器人抵达过程的初步训练,得到所述深度神经网络的最终参数。
优选地,所述步骤S1包括:
将所述柔性机器人视为以弧坐标为自变量的连续模型,所述柔性机器人的空间位姿可以看作横截面绕中心线的转动或移动;
建立基于Cosserat杆模型的所述柔性机器人的动力学模型;
所述动力学模型采用如下公式进行表示:
式中,F为截面上内力;M为截面上的主矩;f为柔性机器人的单节杆上均匀分布力;m为柔性机器人的单节杆上均匀力矩;J=J(s,t)是单位长度杆的惯量张量;ρ为柔性机器人单位长度杆的密度;S为柔性机器人单位长度杆的截面面积;Ω为截面主轴坐标系P-xyz中P点在惯性坐标系中关于时间变量t的角速度。
优选地,所述步骤S2包括:采用实验室外部标定测量相机实时采集所述柔性机器人末端抵达过程的随机轨迹数据;
根据所述动力学模型将所述随机轨迹数据转化为训练数据,得到随机轨迹数据集Drand=(s1,a1,r1,s2,a2,r2,...sT,aT,rT);其中,st表示当前时刻为t时的所述柔性机器人的状态;at表示当前时刻为t时的所述柔性机器人的动作;rt表示当前时刻为t时的预测环境的奖励;t=1,2,...,T;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海航天控制技术研究所,未经上海航天控制技术研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010635603.4/2.html,转载请声明来源钻瓜专利网。