[发明专利]柔性机器人末端抵达控制方法、电子设备和存储介质在审
申请号: | 202010635603.4 | 申请日: | 2020-07-03 |
公开(公告)号: | CN111783250A | 公开(公告)日: | 2020-10-16 |
发明(设计)人: | 孙俊;武海雷;韩飞;孙玥;刘超镇;阳光 | 申请(专利权)人: | 上海航天控制技术研究所 |
主分类号: | G06F30/17 | 分类号: | G06F30/17;G06F30/27;G06N3/04;B25J9/16 |
代理公司: | 上海元好知识产权代理有限公司 31323 | 代理人: | 章丽娟;周乃鑫 |
地址: | 201109 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 柔性 机器人 末端 抵达 控制 方法 电子设备 存储 介质 | ||
1.一种柔性机器人末端抵达控制方法,其特征在于,包括:
步骤S1、建立柔性机器人的动力学模型;
步骤S2、根据所述动力学模型建立深度神经网络,所述深度神经网络用于拟合所述动力学模型;
步骤S3、对所述深度神经网络进行第一次柔性机器人末端抵达过程的初步训练,得到所述深度神经网络的初始参数;
步骤S4、对所述深度神经网络进行第二次柔性机器人抵达过程的初步训练,得到所述深度神经网络的最终参数。
2.如权利要求1所述的柔性机器人末端抵达控制方法,其特征在于,所述步骤S1包括:
将所述柔性机器人视为以弧坐标为自变量的连续模型,所述柔性机器人的空间位姿可以看作横截面绕中心线的转动或移动;
建立基于Cosserat杆模型的所述柔性机器人的动力学模型;
所述动力学模型采用如下公式进行表示:
式中,F为截面上内力;M为截面上的主矩;f为柔性机器人的单节杆上均匀分布力;m为柔性机器人的单节杆上均匀力矩;J=J(s,t)是单位长度杆的惯量张量;ρ为柔性机器人单位长度杆的密度;S为柔性机器人单位长度杆的截面面积;Ω为截面主轴坐标系P-xyz中P点在惯性坐标系中关于时间变量t的角速度。
3.如权利要求2所述的柔性机器人末端抵达控制方法,其特征在于,所述步骤S2包括:采用实验室外部标定测量相机实时采集所述柔性机器人末端抵达过程的随机轨迹数据;
根据所述动力学模型将所述随机轨迹数据转化为训练数据,得到随机轨迹数据集Drand=(s1,a1,r1,s2,a2,r2,...sT,aT,rT);其中,st表示当前时刻为t时的所述柔性机器人的状态;at表示当前时刻为t时的所述柔性机器人的动作;rt表示当前时刻为t时的预测环境的奖励;t=1,2,...,T;
将当前时刻为t时的所述状态st和所述动作at作为输入,则能够预测下一时刻的状态st+1的状态转化预测模型P(st+1|st,at)表示如下:
st+1~P(st+1|st,at)
将当前时刻为t时的所述状态st和所述动作at作为输入,则能够下一时刻的预测环境的奖励rt+1的奖励预测模型R(rt+1|st,at)表示如下:
rt+1~R(rt+1|st,at)
根据所述状态转化预测模型P(st+1|st,at)和奖励预测模型R(rt+1|st,at)将所述随机轨迹数据集Drand=(s1,a1,r1,s2,a2,r2,...sT,aT,rT)分别转化为包含T-1组训练样本的密度估计模型训练集和回归模型训练集;
所述密度估计模型训练集表示如下:
(s1,a1)→s2,(s2,a2)→s3,...(sT-1,aT-1)→sT
所述回归模型训练集表示如下:
(s1,a1)→r2,(s2,a2)→r3,...(sT-1,aT-1)→rT。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海航天控制技术研究所,未经上海航天控制技术研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010635603.4/1.html,转载请声明来源钻瓜专利网。