[发明专利]基于事件驱动的无人机吊挂系统在线轨迹规划方法在审

专利信息
申请号: 202111114973.4 申请日: 2021-09-23
公开(公告)号: CN113759979A 公开(公告)日: 2021-12-07
发明(设计)人: 鲜斌 申请(专利权)人: 天津大学
主分类号: G05D1/10 分类号: G05D1/10
代理公司: 天津市北洋有限责任专利代理事务所 12201 代理人: 刘国威
地址: 30007*** 国省代码: 天津;12
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 事件 驱动 无人机 吊挂 系统 在线 轨迹 规划 方法
【权利要求书】:

1.一种基于事件驱动的无人机吊挂系统在线轨迹规划方法,其特征是,将吊挂系统负载摆角的动力学方程转换成非线性仿射系统的形式,在此基础上引入折现代价函数和强化学习机制,通过神经网络逼近的方法来求解负载摆角抑制的最优控制问题。

2.如权利要求1所述的基于事件驱动的无人机吊挂系统在线轨迹规划方法,其特征是,具体步骤如下:

步骤1)确定四旋翼无人机吊挂系统的坐标系定义;

四旋翼无人机吊挂系统坐标系定义:{I}={xI,yI,zI}表示固定在大地的惯性坐标系,{B}={xB,yB,zB}表示无人机的机体坐标系,xi、yi、zi(i=I,B)分别对应坐标系三个主轴方向的单位矢量;

步骤2)确定四旋翼无人机吊挂系统的动力学模型;

通过分析四旋翼无人机吊挂系统的二维模型,采用欧拉-拉格朗日方法对系统进行建模,通过计算可以得到系统的动力学表达式如下

其中,表示系统的状态向量,y(t)、z(t)分别表示四旋翼无人机在y、z方向的位移,γ(t)表示负载摆角在y、z平面上的分量,Fq=[fy,fz,0]表示系统的控制输入,fy、fz分别表示无人机在y、z方向的升力,Fd=[dy,dz,dγ]表示系统受到的未知外界扰动,dy、dz、dγ分别表示系统受到的外界扰动在y、z、γ方向的分量,M(q)、分别表示四旋翼无人机吊挂系统的惯性矩阵、向心力矩阵以及重力向量,表示实数域,式(1)中M(q)的表达式为

的表达式为

G(q)的表达式为

G(q)=[0 (mL+mQ)g mLglsinγ]T (4)

其中,表示吊挂负载质量,表示无人机质量,表示绳长;

步骤3)定义系统折现代价函数和最优控制律;

将式(1)展开可得负载摆动运动的动力学方程如下

输入仿射形式的动力系统在文献和工程中是常见的,将上式整理为如下的连续时间非线性仿射系统形式

其中,为等效状态向量,为非线性仿射系统的等效输入,在上式中f(x)的表达式为

g(x)的表达式为

f(·)与g(·)满足局部李普希兹(Lipschitz)连续条件,设t=0时,x(0)=x0,且x=0为系统平衡点,此时f(0)=0,在最优调节设计中,针对特定的代价函数来设计状态反馈控制律u(t),选取为正定常数矩阵,为Hermite正定常数阵,定义函数r(x(τ),u(τ))如下

r(x(τ),u(τ))=xT(τ)Qx(τ)+uT(τ)Ru(τ) (9)

定义折现代价函数V(x(t),u(t))如下

其中,η>0为折现因子,用来调节收敛速率,e为自然常数,后文V(x(t),u(t))简写为V(x(t))或者V(x),对于控制输入u(t),若代价函数连续且可微,则

经过适当的数学变换,获得上式中非线性Lyapunov方程的无穷小形式如下式所示

其中,定义系统(6)的哈密尔顿量为

据贝尔曼最优准则,最优代价函数V*(x)的表达式为

上式满足Hamilton Jacobi Bellman方程,即将最优控制律u*(x)设计为

根据以上最优控制律,上述的HJB方程可改写为

因为R为Hermite正定阵,满足(R-1)T=R-1,上式可化为

上式为基于时间的经典HJB方程,即

步骤4)设计事件驱动机制;

定义一个单调递增的触发序列si为i∈N的第i个连续采样时刻,采样输出为采样状态的一个序列,对于所有t∈[si,si+1]有定义事件驱动的误差函数为

当t=si时,ei(t)=0,在每个触发时刻,系统状态是采样的,ei(t)复位为0,反馈控制律

得到更新,控制序列通过零阶保持器可成为一个分段的连续时间信号,

将上述事件触发机制与式(15)中的最优控制律设计相结合,可得如下的控制设计

其中,

步骤5)设计自适应评价网络;

据神经网络的逼近策略,最优代价函数V*(x)可重构为

其中,为理想权值向量,为激活函数,为重构误差,nc为隐含层中神经元的数量,可得上式的梯度向量为

因为ωc未知,采用评价网逼近上述重构后的最优代价函数,可得近似最优代价函数为

其中,为估计权值向量,可得

采用逼近策略重构,式(20)可改写为

采用评价网逼近上述表达式可得基于事件驱动的近似最优控制律为

由以上可得近似哈密尔顿量为

考虑到定义

将上式中的ec(t)对的偏导数定义为ρ(t),即其中,求得如下等式

迭代更新评价网权值使得目标函数最小化,这里采用归一化梯度下降算法,可得评价网络输出权值的更新率为

其中,αc>0为设计的评价网学习率增益;

引入一个额外的Lyapunov候选函数Vs(x)来改进评价网的学习准则,并利用它来调节评价网的权值向量,令Vs(x)为保证时间导数为负的连续可微Lyapunov候选函数,即

据状态向量选择多项式来确定Vs(x),可选取Vs(x)=(1/2)xTx;

当使用式(20)中的基于事件驱动的最优控制律时,为使系统稳定,即需要引入一个额外的项通过沿着的负梯度方向调整来加强训练过程,为此,据式(26)中的基于事件驱动的近似最优控制律,可利用链式法则得到以下梯度下降运算

其中,αs>0为正常数,综上所述,评价网输出权值更新率由两部分组成,即

可得本发明的评价网输出权值更新率为

定义评价网输出权值的估计误差为

为使评价网输出权值估计误差一致最终有界,针对系统状态,需要选取适当的采样频率来获得采样输出作为评价网络的输入,使得||ei(t)||2满足下式

上式定义为事件驱动的触发条件,其中,ψ为正常数,φ∈(0,1)是设计的参数,常量ξ=||θ2||R-1||2,正定矩阵满足R=θTθ;

步骤6)轨迹规划设计;

定义四旋翼无人机规划的期望轨迹与标称轨迹的误差信号如下

本发明的四旋翼无人机期望轨迹的加速度与设计为如下形式

上式中的为减摆设计,与为保证系统稳定的辅助函数,kγ、及为正常数增益,标称轨迹与保证了四旋翼无人机能准确到达目标位置,标称轨迹要满足如下条件:(1)yt(t)、zt(t)在有限时间收敛到目标位置,(2)yt(t)、zt(t)的一二阶导数均能随时间收敛到0,且二阶导数的绝对值与一阶导数均是有上界的正实数,(3)初始值应满足当t=0时,yt(t)、zt(t)及其一阶导数均为0;

选用如下的S形曲线作为标称轨迹

其中cy、cz、ny、nz、υ、py及pz为设计的正常数;

步骤7)位置跟踪控制律设计;

为使吊挂系统沿着规划的期望轨迹运动,定义四旋翼无人机实时位置与规划的轨迹之间的误差如下

选取如下的类PD控制器作为轨迹跟踪控制器

其中,及为PD控制器的控制增益,均为正常数,与表示四旋翼无人机在y和z方向上的实时速度分量。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202111114973.4/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top