[发明专利]用于机器人的串联弹性执行器的神经网络模型预测控制方法有效
申请号: | 202110429622.6 | 申请日: | 2021-04-21 |
公开(公告)号: | CN113255208B | 公开(公告)日: | 2023-05-12 |
发明(设计)人: | 单新平;张安龙;严作海 | 申请(专利权)人: | 杭州新剑机器人技术股份有限公司 |
主分类号: | G06F30/27 | 分类号: | G06F30/27;G06N3/044;G06N3/084;G06F111/04;G06F119/14 |
代理公司: | 上海弼兴律师事务所 31283 | 代理人: | 胡美强 |
地址: | 311321 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 机器人 串联 弹性 执行 神经网络 模型 预测 控制 方法 | ||
1.一种用于机器人的串联弹性执行器的神经网络模型预测控制方法,所述串联弹性执行器为一种非线性动力系统,其特征在于,所述方法包括:
步骤S1:针对所述串联弹性执行器建立动力学模型;
步骤S2:构建并训练用于逼近所述非线性动力系统的动态循环神经网络,其中选取适于所述动态循环神经网络的训练方法以及设置神经网络的超参数;
步骤S3:将训练得到的所述动态循环神经网络作为模型应用至所述非线性动力系统中,并通过将和所述非线性动力系统相关联的当前测量值及历史时刻测量值输入到所述动态循环神经网络中,从而获得和所述非线性动力系统相关联的系统状态输出预测值,以此测试所述动态循环神经网络的多步预测误差,若多步预测误差超出预设的误差阈值,则返回步骤S2继续训练,直到多步预测误差在预设的误差阈值的范围内;
步骤S4,其包括以下子步骤:
输入针对所述非线性动力系统的期望轨迹、当前时刻状态和历史时刻状态至所述动态循环神经网络;
使用所述动态循环神经网络预测未来时刻的系统输出;
确定和所述非线性动力系统相关联的价值函数,并根据时间对所述价值函数进行反向传播求导;
采用随机梯度下降法优化求解,从而得到用于实现所述期望轨迹的未来时刻的最优系统控制输入序列。
2.根据权利要求1所述的神经网络模型预测控制方法,其特征在于,所述方法包括,随着新获得的当前测量值及历史时刻测量值,循环执行获得所述系统状态输出预测值的步骤S3以及优化求解的步骤S4。
3.根据权利要求1所述的神经网络模型预测控制方法,其特征在于,所述动态循环神经网络由以下公式(1)所限定:y(n+1)=f(y(n),y(n-1),…,y(n-dy+1),u(n),u(n-1),u(n-2),…,u(n-du+1))(1)其中,y(n+1)为(n+1)时刻系统输出状态,y(n)为n时刻系统输出状态,dy为时延常数,u(n)为n时刻的系统控制输入,du为系统控制输入时延常数;
其中,训练所述动态循环神经网络的方法采用Adam算法。
4.根据权利要求3所述的神经网络模型预测控制方法,其特征在于,Adam算法利用梯度的一阶矩估计和二阶矩估计动态调整所述动态循环神经网络所包含的各个参数的学习率。
5.根据权利要求4所述的神经网络模型预测控制方法,其特征在于,所述价值函数为二次型函数,步骤S4中,使用所述动态循环神经网络预测未来时刻的系统输出的预测时域为5步,所述最优系统控制输入序列的控制时域为1步。
6.根据权利要求5所述的神经网络模型预测控制方法,其特征在于,每一步的时间间隔为20毫秒。
7.根据权利要求1所述的神经网络模型预测控制方法,其特征在于,所述非线性动力系统包括以SVPWM方式驱动的直流无刷电机,所述方法中采用电流保护条件作为步骤S3和S4中的预测控制求解过程中的约束项。
8.根据权利要求7所述的神经网络模型预测控制方法,其特征在于,所述非线性动力系统还包含控制器饱和约束项。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州新剑机器人技术股份有限公司,未经杭州新剑机器人技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110429622.6/1.html,转载请声明来源钻瓜专利网。