[发明专利]一种基于深度学习的机器人动力学建模方法有效
申请号: | 201810408136.4 | 申请日: | 2018-04-28 |
公开(公告)号: | CN108621159B | 公开(公告)日: | 2020-05-19 |
发明(设计)人: | 邵振洲;孙鹏飞;渠瀛;关永;施智平;王晓东 | 申请(专利权)人: | 首都师范大学 |
主分类号: | B25J9/16 | 分类号: | B25J9/16 |
代理公司: | 北京永创新实专利事务所 11121 | 代理人: | 冀学军 |
地址: | 100048 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于深度学习的机器人动力学建模方法,属于智能机器人领域,收集数据划分为训练集和数据集,构建动力学模型搭建RNN循环神经网络;按时间步划分训练集输入到输入隐藏层,转化为三维数据到达GRU cell层,把当前输入的信息与之前的信息相结合,计算前一时刻的状态信息参与到新生成的状态的比例;然后将计算得到的当前的候选状态和前一个时间步时刻的信息通过更新门选择,得到当前时刻的隐藏层状态,传递到下一时间步,输出到输出隐藏层,得到预测值小于等于误差阈值采集的真实结果,为最优值。最后利用数据集对GRU门控循环单元网络进行检测。本发明提高扭矩预测的精度,大大减小输入信号的训练时间,减小了传统反向传播的梯度误差。 | ||
搜索关键词: | 一种 基于 深度 学习 机器人 动力学 建模 方法 | ||
【主权项】:
1.一种基于深度学习的机器人动力学建模方法,其特征在于,具体步骤如下:步骤一、针对某机器人,收集该机器人的关节位置,关节速度,关节加速度以及对应的扭矩数据,并划分为训练集和数据集;步骤二、构建针对机器人的关节位置,关节速度和关节加速度的动力学模型τ;
矢量q表示关节位置;
表示关节速度;
表示关节加速度;τ表示要学习的扭矩,代表着控制关节运动的力(矢量)进而控制机械臂的运动趋势;M(q)表示惯性矩阵,
表示结合了科氏力、向心力、摩擦力和重力的作用;表达式为:![]()
表示科氏力,
表示摩擦力;g(q)表示重力;
为模拟函数,模拟其他因素;步骤三、根据动力学模型τ设置输入向量x的目标学习函数y;y=f(x);y=τ,x为输入的矢量值,包括机器人的关节位置,关节速度和关节加速度;步骤四、搭建包括输入隐藏层,GRU cell层和输出隐藏层的RNN循环神经网络,用于对目标学习函数y进行优化;GRU cell层包括更新门和重置门;步骤五、针对训练集,按时间步进行划分,并输入到RNN循环神经网络的输入隐藏层,经过运算转化为三维数据到达GRU cell层;Xt=Wi·xt+bixt是t时刻起始输入,Xt是通过输入隐藏层后t时刻要输入GRU的向量,Wi为输入隐藏层的权重;bi为输入隐藏层的偏置值;步骤六、当三维数据进入GRU cell层中,根据规则判断是否有用,如果是,进入重置门把当前输入的信息与之前的信息相结合,进入步骤七;否则,进入步骤九,通过更新门决定有多少之前的信息向下传递到当前状态;步骤七、当三维数据输入到达重置门时,计算前一时刻的状态信息参与到新生成的状态的比例rt;针对时间步t时刻,比例rt计算公式如下:rt=σ(Wr·[ht‑1,Xt]+br);σ为sigmoid函数;Wr表示重置门的权重;br是重置门的偏置值;Xt为t时刻的输入向量,包括关节位置,关节速度和关节加速度;ht‑1保存的是前一个时间步t‑1时刻的信息;步骤八、根据t时间步的比例rt,计算输入到达重置门的三维数据当前的候选状态
进入步骤十;计算公式如下:![]()
表示当前候选状态的权重;bh是隐藏层的偏置值;步骤九、当三维数据输入到达更新门时,计算前一时刻的信息传递到当前状态的比例zt;针对t时间步,比例zt计算公式如下:zt=σ(Wz·[ht‑1,Xt]+bz);Wz表示更新门的权重;bz是更新门的偏置值;步骤十、把当前的候选状态
和前一个时间步t‑1时刻的信息通过更新门的选择,得到当前时刻的隐藏层状态,并将其传递到下一时间步;
步骤十一、当前t时间步训练集的数据全部传输完毕,得到当前t时间步时刻对应的隐藏层状态值ht;步骤十二、根据当前t时间步时刻对应的隐藏层状态值ht,并输出到RNN循环神经网络的输出隐藏层,得到t时间步通过动力学模型的预测值;yt=WO·ht+boWO表示输出的权重;bo表示输出的偏置值;步骤十三、利用均方误差训练公式MSE对输出隐藏层输出的最终测试结果和采集的真实结果进行对比;均方误差训练公式如下:
d代表关节的数量,n代表数据的数量,j代表关节累加的基数为从1开始,t代表时间步累加的基数为从1开始,
代表采集的真实结果,即为输入的实际扭矩,
代表着通过动力学模型预测出来的扭矩,即最终的测试结果;步骤十四、判断对比结果是否小于等于误差阈值,如果是,则结束,最终的Wr,Wz,
WO,Wi,br,bh,bz,bo,bi为RNN循环神经网络的最优值;否则,通过优化器以一定的学习率来改变权重和偏置值,进而减小误差,然后进入步骤五重复测试N次,直至得到RNN循环神经网络Wr,Wz,
WO,Wi,br,bh,bz,bo,bi的最优值;步骤十五、利用数据集对得到最优值Wr,Wz,
WO,Wi,br,bh,bz,bo,bi的GRU门控循环单元网络进行检测。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于首都师范大学,未经首都师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810408136.4/,转载请声明来源钻瓜专利网。