[发明专利]一种模块化机器人系统的非零和博弈神经-最优控制方法在审
申请号: | 202110316833.9 | 申请日: | 2021-03-18 |
公开(公告)号: | CN113093538A | 公开(公告)日: | 2021-07-09 |
发明(设计)人: | 张振国;刘克平;董博;朱新野;马冰;王悦西;杨宏韬;李岩 | 申请(专利权)人: | 长春工业大学 |
主分类号: | G05B13/04 | 分类号: | G05B13/04 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 130012 吉林*** | 国省代码: | 吉林;22 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 模块化 机器人 系统 博弈 神经 最优 控制 方法 | ||
本发明提出了一种模块化机器人系统的非零和博弈神经‑最优控制方法,首先基于力矩反馈技术建立了模块化机器人的动力学模型,并将动力学模型描述为一类存在交联耦合项的子系统整合的形式。基于局部动力学信息的鲁棒控制律补偿系统的摩擦项,将最优轨迹跟踪问题转化为n个参与者的非零和神经‑最优控制问题。采用自适应动态规划算法,对评判函数用单评判网络进行逼近,并解决了耦合的哈密顿‑雅可比方程。
技术领域
本发明涉及不确定环境下补偿-评判结构的模块化机器人非零和博弈神经-最优控制方法,属于机器人控制算法领域。
背景技术
模块化机器人由电源、处理系统、执行器和传感器等模块组成。这些模块组合满足不同构形的标准机电接口来适应复杂工作环境的各种任务要求,基于上述优点,模块化机器人经常应用于不确定环境中,例如人机交互、外界碰撞等。此外,在不确定环境下,模块化机器人需要兼顾控制精度和功耗的合适控制系统。
最优控制作为控制理论的重要组成部分,其研究的核心问题是对于一个给定的被控系统,选择合适的控制策略使系统的某些性能指标达到最优。对于模块化机器人系统,获取其最优控制策略则需要求解耦合的哈密顿-雅克比方程,而该方程是一类非线性偏微分方程,难以用解析方法求得最优解。自适应动态规划方法是一种解决非线性系统最优控制问题的强有力工具,在自适应动态规划系统中,神经网络被设计用来近似性能指标函数并估计哈密顿-雅克比方程的解。
对于不确定环境下的非线性系统,尤其是模块化机器人系统,通过设计补偿-评判结构的非零和神经-最优控制,并结合通过求解耦合的哈密顿-雅克比方程得到非零和最优控制律,运用到动力学模型,获得关节位置变量。
发明内容
本发明为了解决传统的模块化机器人控制方法中存在不确定环境情况下,机器人关节的跟踪性能较低的问题,提出一种性能较好的非零和最优控制方法,以实现不确定环境下模块化机器人系统的高精度非零和最优控制。将模块化机器人系统的动力学模型描述为一个相互耦合的子系统的合成,通过求解耦合的HJ方程,结合补偿结构以及近似性能指标函数对位置和速度跟踪性能及各关节模块的控制力矩进行优化,并最终实现完备的非零和神经-最优控制。
本发明解决技术问题的方案是:
一种模块化机器人系统的非零和博弈神经-最优控制方法,其特征是,首先建立模块化机器人系统动力学模型,通过对模块化机器人关节子系统间的耦合交联项的分析,然后构建代价函数与耦合的HJ方程,接下来采用神经网络对代价函数进行近似,从而得到本发明所提出的补偿-评判结构的非零和博弈神经-最优控制律。
该方法包括如下步骤:
step1,建立模块化机器人系统动力学模型如下:
上式中,下标i代表第i个模块,Imi是转动轴的转动惯量,γi是齿轮传动比,θi,和分别是关节位置,速度和加速度,是关节摩擦项,是关节子系统间的关节子系统间的耦合交联项,τis是关节输出转矩,τi是电机输出转矩;
令gi=(Iimγi)-1∈R+,定义状态向量控制输入ui=τi。重新改写式(1)中第i个子系统的动力学模型可以得到:
其中,表示动力学模型中的已精确建模和估计的部分,是模型不确定项,包括摩擦模型误差和关节子系统间的耦合力矩交联项以及不确定环境项。定义系统的状态向量控制输入ui=τi;
step2,构建代价函数为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于长春工业大学,未经长春工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110316833.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种生物电刺激教学仪器
- 下一篇:一种基于北斗的抗疫手表