[发明专利]基于DQN的无人机机动策略自主生成方法有效
申请号: | 201910853736.6 | 申请日: | 2019-09-10 |
公开(公告)号: | CN110531786B | 公开(公告)日: | 2022-07-22 |
发明(设计)人: | 张堃;李珂;时昊天;赵权 | 申请(专利权)人: | 西北工业大学 |
主分类号: | G05D1/10 | 分类号: | G05D1/10 |
代理公司: | 西安凯多思知识产权代理事务所(普通合伙) 61290 | 代理人: | 刘新琼 |
地址: | 710072 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供了一种基于DQN的无人机机动策略自主生成方法,分别建立无人机三自由度运动模型、无人机机动控制模型、基准地形三维模型和山峰三维模型;计算无人机当前位置下所受地形障碍影响程度值;构建评价网络和目标网络,对评价网络进行训练;使用训练结果作为无人机飞行控制外环控制器,控制无人机的两向过载和无人机速度倾斜角。本发明将深度强化学习方法和无人机的制导与控制机动策略进行结合,在离线仿真环境中进行学习训练,达到要求后再进行实际应用,极大地增强了无人机在执行任务过程中的自主性,提高了无人机执行任务的效率。 | ||
搜索关键词: | 基于 dqn 无人机 机动 策略 自主 生成 方法 | ||
【主权项】:
1.一种基于DQN的无人机机动策略自主生成方法,其特征在于包括以下步骤:/n1)建立无人机三自由度运动模型;/n2)建立无人机机动控制库;/n3)建立基准地形三维模型和山峰三维模型;/n4)计算无人机当前位置下所受地形障碍影响程度值;/n5)构建评价网络Q(s,a)与目标网络Q′(s,a),所述两个网络均属于深度神经网络;Q(s,a)和Q′(s,a)两个网络采用相同的参数进行初始化;/nQ(s,a)网络和Q′(s,a)网络采用三层网络,每层之间神经元两两连接,激活函数使用线性整流函数ReLU;/n定义状态空间 式中,x,y,z为无人机在地理坐标系中的位置,v为无人机的速度标量,θ为无人机航迹倾斜角,ψc为无人机航迹偏转角;/n定义动作空间 包括了飞机基本操作动作库中的7种基本机动ai,a=[Nx,Ny,γc],Nx为无人机在飞机坐标系中的切向过载,Ny为无人机在飞机坐标系中的法向过载,γc为无人机的速度轴系倾斜角;/n定义收益r=-(g(XUAV)+p(XUAV)),g(XUAV)为无人机所受飞行环境的影响值,p(XUAV)为无人机与终点的距离,r为无人机当前的收益;/n定义回放经验 式中,s为当前状态,a为当前状态下无人机所选的动作,r为无人机执行a后所得的收益,s′为无人机执行a后的状态;/n6)对评价网络Q(s,a)进行训练;/n7)使用训练结果Q′(s,a;θ-)网络作为无人机飞行控制外环控制器,周期性地选择无人机的机动动作,从而进一步控制无人机的两向过载Nx、Ny和无人机速度倾斜角γc。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西北工业大学,未经西北工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910853736.6/,转载请声明来源钻瓜专利网。