[发明专利]基于强化学习的海域安全通信无人机轨迹实时规划方法在审
申请号: | 202211024919.5 | 申请日: | 2022-08-25 |
公开(公告)号: | CN115407794A | 公开(公告)日: | 2022-11-29 |
发明(设计)人: | 王伟;杨永杰;陈俊杰;曹张华;孙强;刘锦涛;吴磊 | 申请(专利权)人: | 南通先进通信技术研究院有限公司;南通大学 |
主分类号: | G05D1/10 | 分类号: | G05D1/10;H04B7/185;H04B13/02;H04B17/336;H04B17/391;G06N20/00 |
代理公司: | 南京经纬专利商标代理有限公司 32200 | 代理人: | 张俊俊 |
地址: | 226019 江苏省南*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 强化 学习 海域 安全 通信 无人机 轨迹 实时 规划 方法 | ||
1.基于强化学习的海域安全通信无人机轨迹实时规划方法,其特征在于,包括以下步骤:
步骤一、建立联合大尺度衰落和小尺度衰落的UAV-船舶信道模型;
步骤二、通过船载AIS获得船舶的航道信息,并分别得到移动船舶、窃听节点接收的信干燥比和速率;
步骤三、通过求解系统最大平均保密速率来获得无人机的最优轨迹;
步骤四、基于离散空间的无人机运动模型和基于连续空间的无人机运动模型,分别使用Q-learning和DDPG算法来进行轨迹优化;
步骤五、设置相关仿真参数;
步骤六、展示不同起飞位置下两种算法的UAV轨迹实时规划结果、不同船舶航迹下两种算法的UAV轨迹实时规划结果、两种算法每次迭代得到的平均奖励和不同飞行时间下不同算法得到的平均保密速率。
2.根据权利要求1所述的基于强化学习的海域安全通信无人机轨迹实时规划方法,其特征在于,所述步骤一中,假设将无人机S的飞行时间T按极小等间隔dt化分成N个时隙,即T=Ndt;在每个时隙内,考虑到实际的海域信道特性容易受到海面状况和气象条件环境因素的影响,因此,无人机-移动船舶或窃听的信道衰落模型建模成包括大尺度衰落和小尺度衰落的表示形式:
其中,gsd[n]为无人机S到移动船舶D的信道功率增益,为无人机S到窃听节点Ek的信道功率增益;
式中,表示UAV到船舶D的距离,表示UAV到窃听Ek的距离。
3.根据权利要求1所述的基于强化学习的海域安全通信无人机轨迹实时规划方法,其特征在于,所述步骤二中,海洋上的船只是沿着预先规划好的航道行驶,而航道信息通过船载AIS获得,因此假设船舶D的航线为:
其中,Vd为船舶最大航运速度,dt表示时隙,xd[n]表示船舶D在n时隙在x轴的坐标,xd[n+1]表示船舶D在n+1时隙在x轴的坐标,yd[n]表示船舶D在n时隙在y轴的坐标,yd[n+1]表示船舶D在n+1时隙在y轴的坐标,(xd[n],yd[n])和(xd[n+1],yd[n+1])分别表示船舶在n和n+1时隙的位置;
移动船舶D接收的信干燥比和速率为:
式中:SINR表示信干燥比,SINRd表示船舶D的信干燥比,Rd表示船舶D的速率,Ps[n]表示UAV的发射功率;表示船舶D处的噪声方差;
窃听节点接收的信干燥比和速率为:
式中,SINR表示信干燥比,表示窃听节点E的信干燥比,表示窃听E处的噪声方差;
对系统进行优化,系统最大的平均保密速率表示为:
式中,为无人机最大水平飞行速度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南通先进通信技术研究院有限公司;南通大学,未经南通先进通信技术研究院有限公司;南通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211024919.5/1.html,转载请声明来源钻瓜专利网。