[发明专利]一种基于异步多线程方式的雷达干扰决策方法在审
申请号: | 202111592778.2 | 申请日: | 2021-12-23 |
公开(公告)号: | CN114415125A | 公开(公告)日: | 2022-04-29 |
发明(设计)人: | 牛朝阳;邹玮琦;刘伟;李润生;王世举;高欧阳 | 申请(专利权)人: | 中国人民解放军战略支援部队信息工程大学 |
主分类号: | G01S7/38 | 分类号: | G01S7/38 |
代理公司: | 郑州大通专利商标代理有限公司 41111 | 代理人: | 周艳巧 |
地址: | 450000 河*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 异步 多线程 方式 雷达 干扰 决策 方法 | ||
本发明属于雷达认知干扰技术领域,特别涉及一种基于异步多线程方式的雷达干扰决策方法,通过构建与多功能雷达环境进行交互的干扰机模型,其中,所述干扰机模型包含:若干通过策略网络从干扰库中选取指定时刻作用于雷达的干扰样式并利用价值网络分析雷达任务状态转变过程中干扰样式有效性的干扰线程,及用于对各干扰线程中策略网络和价值网络参数进行汇总分发来更新全局网络参数的全局网络;利用干扰机模型干扰目标方多功能雷达认知来实现实时对抗防御。本发明能够在保证决策性能的情况下,极大提高时间效率,满足实时性要求,便于实际场景应用。
技术领域
本发明属于雷达认知干扰技术领域,特别涉及一种基于异步多线程方式的雷达干扰决策方法。
背景技术
雷达对抗防御中,采用专门的电子设备和器材对对方雷达进行侦察和干扰,其主要包括雷达侦察和雷达干扰,目的是获取对方雷达技术信息,以采取相应的措施来阻碍雷达的正常工作,减低雷达的工作效能。在雷达干扰技术中,有将认知理论引入在雷达干扰决策中,在假定工作模式数已知的情况下提出基于Q-学习算法的认知雷达对抗过程设计;并在雷达工作模式未知的基础上提出了基于Q-学习的智能雷达对抗过程设计;还有,通过分析多功能雷达工作状态及对应干扰样式构建雷达状态转移图,仿真分析各参数对干扰决策性能的影响,以及在新状态加入下的决策过程、转移概率对决策路径的影响。但该策略随着MFR的雷达任务个数的增多效率逐渐下降,现有雷达对抗防御的干扰方和被干扰方的对抗稍纵即逝,目前已有的技术仍然难以满足雷达对抗决策的高实时性要求。
发明内容
为此,本发明提供一种基于异步多线程方式的雷达干扰决策方法,能够在保证决策性能的情况下,极大提高时间效率,满足实时性要求,便于实际场景应用。
按照本发明所提供的设计方案,一种基于异步多线程方式的雷达干扰决策方法,包含如下内容:
构建与多功能雷达环境进行交互的干扰机模型,所述干扰机模型包含:若干干扰线程及全局网络,其中,所述干扰线程利用策略网络从干扰库中选取指定时刻作用于雷达的干扰样式,并利用价值网络对雷达任务状态转变过程中干扰样式进行有效性分析,全局网络对各干扰线程中策略网络和价值网络参数进行汇总分发来更新全局网络参数;
通过干扰机模型干扰目标方多功能雷达认知来实现实时对抗防御。
作为本发明一种基于异步多线程方式的雷达干扰决策方法,进一步地,干扰线程中,策略网络π(at|st;θ)通过计算指定时刻t下雷达任务状态st所采取干扰样式动作at的概率分布并基于概率分布从干扰库中选取干扰样式,其中,θ表示策略网络参数。
作为本发明一种基于异步多线程方式的雷达干扰决策方法,进一步地,利用价值网络V(st;θv)获取指定时刻t下雷达任务状态st执行干扰样式动作at的值函数,依据值函数及干扰样式回报值构造优势函数,通过引入优势函数来评价状态动作对(雷达任务状态st,干扰样式动作at)的优势,其中,干扰样式回报值通过指定时刻雷达状态及下一时刻下采取干扰样式动作时雷达任务状态前后变化的即时奖励及衰减因子来获取,θv表示价值网络参数。
作为本发明一种基于异步多线程方式的雷达干扰决策方法,进一步地,优势函数表示为:其中,n表示最大迭代次数,rt表示干扰样式动作at下雷达任务状态前后变化的即时奖励,γi表示迭代轮次i下的衰减因子。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军战略支援部队信息工程大学,未经中国人民解放军战略支援部队信息工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111592778.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:结合RPA和AI的服务接口的配置方法及装置
- 下一篇:一种拖把清洁桶