[发明专利]一种面向覆盖侦察任务的多无人机通信资源分配方法有效
申请号: | 202111093095.2 | 申请日: | 2021-09-17 |
公开(公告)号: | CN114142908B | 公开(公告)日: | 2022-12-09 |
发明(设计)人: | 刘春辉;董赞亮;黄丽珍 | 申请(专利权)人: | 北京航空航天大学 |
主分类号: | H04B7/185 | 分类号: | H04B7/185;H04W16/18;H04W16/22;H04W52/24;H04W72/04;G06N20/00 |
代理公司: | 北京永创新实专利事务所 11121 | 代理人: | 易卜 |
地址: | 100191*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 面向 覆盖 侦察 任务 无人机 通信 资源 分配 方法 | ||
1.一种面向覆盖侦察任务的多无人机通信资源分配方法,其特征在于,具体包括:
首先,搭建M架无人机飞行的任务区域场景模型,考虑无人机飞行环境中的高斯白噪声以及信道间的干扰,建立每条链路的信噪比和信道容量;
链路包括M架无人机与地面调度中心通信的M对U2I链路,用M={1,2,…,m}表示;以及K对无人机间的空-空链路的U2U链路,用K={1,2,…,k}表示;
然后,利用各链路的信噪比和信道容量定义状态空间、动作空间和奖励函数,为每架无人机建立两个结构相同的深度神经网络:Q-eval网络和Q-target网络;以及回放记忆库;
所述的Q-eval和Q-target均为含有3个隐藏层的5层全连接神经网络结构,3个隐藏层中的神经元数量分别为500,250和120,设定每个全连接神经网络的初始权重w和偏差项b分别服从参数为μ(0,0.1),μ(0.05,0.01)的正态分布,且使用Relu激活函数;
奖励函数的表达式为:
Cc[m]表示第m条U2I链路的信道容量,Cu[k]为第k对U2U链路的信道容量,λ为Cc[m]的权重因子,(1-λ)为Cu[k]的权重因子,T0是最大容许延迟,Ut是剩余传输时间;kr为转弯角约束带来的奖励函数;γr为kr对应的权重因子;kd为无人机是否进入侦察区域带来的奖励函数;γd为kd对应的权重因子;kc为覆盖率奖励函数;γc为kc对应的权重因子;
利用奖励函数计算Q值的表达式为:
γ为折扣因子;0<γ<1;
Q-eval网络用于选择最大Q值对应的动作,Q-target网络用于计算在Q-eval网络所选动作下的目标Q值;
回放记忆库用于存储训练样本[st,at,rt,st+1],表示输入当前状态st,输出动作at时,得到的奖励rt,以及采取动作at后下一个状态st+1;
接着,通过从回放记忆库中选择训练样本,结合状态空间、动作空间和奖励函数训练神经网络模型;
最后,加载训练好的神经网络模型,输入无人机群的状态信息st,输出最优Q值对应的动作集,无人机集群系统按照最优动作执行航路规划和通信资源分配输出,并根据侦察覆盖任务目标结束应用。
2.如权利要求1所述的一种面向覆盖侦察任务的多无人机通信资源分配方法,其特征在于,所述搭建任务区域场景模型具体为:根据无人机的监视范围在地面的投影,设定网格的单元宽度,将任务区域栅格化;无人机集群内的每架无人机速度相同,且在完成任务前保持匀速飞行。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学,未经北京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111093095.2/1.html,转载请声明来源钻瓜专利网。