[发明专利]一种基于强化学习的固定翼无人机群集控制方法有效

专利信息
申请号: 201910832116.4 申请日: 2019-09-04
公开(公告)号: CN110502033B 公开(公告)日: 2022-08-09
发明(设计)人: 王菖;闫超;相晓嘉;牛轶峰;尹栋;吴立珍;陈紫叶 申请(专利权)人: 中国人民解放军国防科技大学
主分类号: G05D1/10 分类号: G05D1/10
代理公司: 湖南兆弘专利事务所(普通合伙) 43008 代理人: 周长清
地址: 410073 湖南*** 国省代码: 湖南;43
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 强化 学习 固定 无人机 群集 控制 方法
【权利要求书】:

1.一种基于强化学习的固定翼无人机群集控制方法,其特征在于,包括:

步骤S1、训练阶段:建立随机无人机动力学模型、执行器深度神经网络和评价器深度神经网络,持续采集智能体与环境进行交互的历史经验,并存储到经验池中;从经验池中随机进行批次采样,不断更新执行器和评价器的网络参数,最终形成保存评价器网络模型;

步骤S2、执行阶段:僚机通过传感器获取自身位置和姿态信息,载入评价器网络模型,评价器根据当前系统联合状态输出僚机最佳滚转动作,长机滚转角设定值由操控员给出;直至完成飞行任务;

所述步骤S1中包括:

步骤S11、考虑无人机在恒定高度飞行,其动力学模型用简化的四自由度模型描述;在滚转、空速各个子状态引入随机性,建立随机无人机动力学模型;

步骤S12、分别建立执行器深度神经网络和评价器深度神经网络,将输入状态映射到输出动作和该状态的累计折扣回报,并随机初始化网络参数;

步骤S13、持续采集智能体与环境进行交互的历史经验,所述智能体为僚机,并存储到经验池中;

步骤S14、从经验池中随机进行批次采样,应用Adam算法不断更新执行器和评价器的网络参数;所有样本均会用于更新评价器网络的参数,但只有TD误差为正的样本才会使执行器的网络参数发生改变;

步骤S15、当训练情节数达到预设条件时,结束交互过程,并保存评价器网络的模型参数;

所述步骤S2中包括:

步骤S21、智能体通过传感器获取自身位置和姿态信息,并通过通信链路获取长机的位置和姿态信息,进而组成系统联合状态;

步骤S22、载入评价器网络模型,评价器根据当前系统联合状态输出僚机最佳滚转动作;长机滚转角设定值由操控员给出;

步骤S23、长机和僚机的自驾仪根据各自的滚转角设定值,由PID控制器完成底层闭环控制;

步骤S24、重复上述过程,直至完成飞行任务。

2.根据权利要求1所述的基于强化学习的固定翼无人机群集控制方法,其特征在于,所述步骤S13中,所述历史经验为四元组(zk,ak,gk,zk+1),其中zk为当前状态,ak为执行动作,gk为执行动作ak获取的回报,zk+1为执行动作ak后达到的状态;所述交互过程为:长机的滚转动作随机产生以增加系统的随机性;智能体获取长机的状态信息及自身的状态信息,组成联合状态信息输入到执行器中,高斯探索策略根据执行器输出选取僚机的滚转动作;分别将长机和僚机的滚转指令输入随机无人机动力学模型,得到长机和僚机下一时刻的状态和回报函数值。

3.根据权利要求1所述的基于强化学习的固定翼无人机群集控制方法,其特征在于,所述建立执行器深度神经网络,执行器对应动作选择策略,使用多层感知机将输入状态映射到输出动作;执行器MLP包括1层输入层、4层隐含层和1层输出层;隐含层的节点数分别取128、256、256和64;隐含层均使用ReLU激活函数,其表达式为:f(x)=max(0,x);输出层使用tanh激活函数,其表达式为f(x)=(ex-e-x)/(ex+e-x),以保证评价器输出值在[-1,+1]之间,线性放大后即映射到滚转动作空间。

4.根据权利要求1所述的基于强化学习的固定翼无人机群集控制方法,其特征在于,所述建立评价器深度神经网络,评价器对应价值函数,使用MLP将输入状态映射到该状态的累计折扣回报;评价器MLP包括1层输入层、4层隐含层和1层输出层;隐含层的节点数分别取128、256、256和64;隐含层均使用ReLU激活函数,其表达式为:f(x)=max(0,x);输出层使用linear激活函数,其表达式为:f(x)=x。

5.根据权利要求1所述的基于强化学习的固定翼无人机群集控制方法,其特征在于,所述评价器网络模型运行在僚机机载电脑上,输出的滚转指令每隔1s更新一次。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军国防科技大学,未经中国人民解放军国防科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910832116.4/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top