[发明专利]机器人免逆解控制系统参数的自调节及优化方法有效
申请号: | 201910864210.8 | 申请日: | 2019-09-12 |
公开(公告)号: | CN110501903B | 公开(公告)日: | 2022-09-23 |
发明(设计)人: | 陈盛;丁胜利;梁志伟;高翔;徐国政 | 申请(专利权)人: | 南京邮电大学 |
主分类号: | G05B13/02 | 分类号: | G05B13/02 |
代理公司: | 南京苏高专利商标事务所(普通合伙) 32204 | 代理人: | 柏尚春 |
地址: | 210046 江苏省*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 机器人 免逆解 控制系统 参数 调节 优化 方法 | ||
1.一种机器人免逆解控制系统参数的自调节及优化方法,其特征在于,包括以下步骤:
(1)构建神经网络,将机器人执行运动的误差以及误差的差分函数作为神经网络的输入,利用遗传算法对神经网络进行训练,训练完毕后神经网络输出控制系统参数;所述神经网络的输入为机器人运动过程中采样得到的离散化的角度误差e(k),一阶差分e(k)-e(k-1)和二阶差分e(k)-2e(k-1)+e(k-2);所述利用遗传算法对神经网络进行训练的方法为:
(1.1)起始时随机产生一组权值阈值个体,每个权值阈值个体为一组包含了神经网络各层权值和阈值的实数串,作为神经网络对应的权值和阈值;
(1.2)将所述误差作为单个权值阈值个体的适应度值,计算公式如下:
V适=Kx-1,
或者
V适=Ke-x,
其中,V适为适应度值,x为系统误差,K为系数,e为自然底数;
(1.3)从种群个体中选择适应度好的个体组合成用来繁殖的种群,被选中的概率如下:
P选=V适/N
其中,N是V适可取值的最大值;
(1.4)对步骤(1.3)选出来的种群个体两两进行交叉繁殖,两个个体交叉繁殖的公式如下:
akj=akj+P×(alj-akj)
alj=alj+P×(akj-alj)
其中,akj表示个体k的第j位基因,alj表示个体l的第j位基因,P是[0,1]之间的随机数;
(1.5)随机选择步骤(1.4)中的个体进行变异操作,公式如下:
akj=e-P×akj;
(1.6)将产生的新的权值阈值个体更新神经网络的权值阈值;
(1.7)神经网络输出控制系统参数,将机器人重新执行运动,若重新执行运动的误差未达到设定要求,则返回步骤(1.2),若重新执行运动的误差达到设定要求,训练结束;
(2)通过强化学习对控制系统参数进行优化;
(3)对优化后的控制系统参数进行回归分析并拟合成与e相关的n阶函数,e为机器人关节目标角度和实际角度的差值,得到优化后的控制系统。
2.根据权利要求1所述机器人免逆解控制系统参数的自调节及优化方法,其特征在于:步骤(1)中的神经网络为BP神经网络,神经网络的每一个输出层节点分别对应一个PID控制参数。
3.根据权利要求1所述机器人免逆解控制系统参数的自调节及优化方法,其特征在于,所述误差包括了运行的时间误差、运行的能量误差和运行的轨迹误差。
4.根据权利要求1所述机器人免逆解控制系统参数的自调节及优化方法,其特征在于,步骤(2)具体为:
(1)选择进行优化的机器人关节和参数K,并将差值e和参数K作为强化学习的状态转移变量,差值e为关节目标角度和实际角度的差值;
(2)初始化强化学习状态矩阵;
(3)机器人更新参数进行运动;
(4)根据机器人运动的误差进行奖惩并更新状态矩阵中的奖惩值,当未达到设置的训练时间或者训练步数返回步骤(3),当达到设置的训练时间或者训练步数,结束强化学习。
5.根据权利要求1所述机器人免逆解控制系统参数的自调节及优化方法,其特征在于,步骤(3)中拟合方法为最小二乘法或者机器学习方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910864210.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种单输入模糊滑动平面控制方法
- 下一篇:一种电液伺服系统主动容错控制方法