[发明专利]一种基于深度强化学习的伪装干扰波形生成方法有效
申请号: | 202110632548.8 | 申请日: | 2021-06-07 |
公开(公告)号: | CN113406579B | 公开(公告)日: | 2022-09-27 |
发明(设计)人: | 高敬鹏;王国轩;马静;綦俊炜;王廷飞;高路;江志烨;郑沛 | 申请(专利权)人: | 哈尔滨工程大学 |
主分类号: | G01S7/38 | 分类号: | G01S7/38 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 150001 黑龙江省哈尔滨市南岗区*** | 国省代码: | 黑龙江;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 强化 学习 伪装 干扰 波形 生成 方法 | ||
本发明属于电子干扰技术领域,具体涉及一种基于深度强化学习的伪装干扰波形生成方法。本发明通过构建深度强化学习探索模型,设计状态空间、动作空间、奖励函数,实现了基于深度强化学习的干扰波形生成,该模型中模拟了较为复杂的动态对抗过程,只需当前雷达状态就可以输出对应的干扰波形,在复杂或未知对抗场景下依然能够做出较为有效的干扰波形决策;通过构建伪装生成网络输出伪装信号,并与深度强化学习的生成的干扰信号叠加,得到带有伪装的干扰波形,使得已经训练完成的雷达智能识别网络误判,避免了干扰波形易被雷达方识别的问题,具有较好的干扰和伪装效果。
技术领域
本发明属于电子干扰技术领域,具体涉及一种基于深度强化学习的伪装干扰波形生成方法。
背景技术
干扰波形生成是电子干扰领域内的重要内容。为了提升己方目标突防的成功率,需要对敌方雷达进行有效的干扰,不同干扰波形在不同场景下对雷达的干扰效果是不同的,如何在不同场景下生成合适的干扰波形就变得至关重要。
传统的干扰波形生成方法是在通过侦察手段获取详细雷达参数先验信息的基础上,从固定的干扰策略库中选取或者凭借用户经验制定干扰策略,并从已有的波形库中选取干扰波形,对雷达施加有效的干扰。随着雷达方抗干扰措施的不断完善,人工寻找最佳干扰波形的方法逐渐被淘汰。为此,在获取雷达参数先验信息的基础上,智能算法被用来代替人工寻找最佳干扰波形,如遗传算法、蜂群算法、粒子群算法等,这些方法具有较快的决策速度。但上述方法无法处理或适应未知和复杂对抗场景中的干扰波形决策问题,尤其在面对智能化的雷达对抗系统所产生的参数动态变化时,这些方法就会失效。
西安电子科技大学在其申请的专利“基于深度强化学习的雷达干扰决策方法”(专利申请号:202010029684.3,申请公布号:CN111199127A)中提出了一种基于深度强化学习的雷达干扰决策方法。该方法虽然将深度强化学习应用到干扰决策中,但其构建的动态对抗过程较为简单,仅包含有限数量的雷达工作模式,在未知和复杂对抗场景中显得力不从心,而且生成的干扰波形没有伪装能力,易被雷达方识别,无法欺骗雷达方识别网络。
发明内容
本发明的目的在于针对现有干扰波形生成方法无法处理或适应未知和复杂对抗场景中的干扰波形决策以及易被雷达方识别等问题,提供一种基于深度强化学习的伪装干扰波形生成方法。
本发明的目的通过如下技术方案来实现:包括以下步骤:
步骤1:获取干扰设备的干扰样式编号集合K、干扰信号功率取值区间P、干扰信号带宽取值区间B;
步骤2:构造训练数据集;
步骤2.1:在雷达对目标进行探测时,干扰设备通过截获雷达信号,获取当前雷达状态s;
s={T1,T2,f}
其中,T1为雷达的发射信号脉宽,T2为雷达的发射信号周期,f为雷达的发射信号中心频率;
步骤2.2:干扰设备随机选择动作a={k,p,b},产生干扰信号g对雷达进行干扰;其中,k为干扰信号g所属的干扰样式的编号,k∈K;p为干扰信号g的功率,p∈P;b为干扰信号g的带宽,b∈B;
步骤2.3:干扰设备获取雷达在受到干扰后的状态s′
s′={T′1,T′2,f′};
步骤2.4:计算动作a的奖励值r,生成训练样本(s,a,r,s′);
Pd=xt-1[10lg(VGrσRt-4)]
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工程大学,未经哈尔滨工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110632548.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种处理废水用厌氧水解生物反应成套装置
- 下一篇:一种锂离子电池