[发明专利]一种基于异步多线程方式的雷达干扰决策方法在审
申请号: | 202111592778.2 | 申请日: | 2021-12-23 |
公开(公告)号: | CN114415125A | 公开(公告)日: | 2022-04-29 |
发明(设计)人: | 牛朝阳;邹玮琦;刘伟;李润生;王世举;高欧阳 | 申请(专利权)人: | 中国人民解放军战略支援部队信息工程大学 |
主分类号: | G01S7/38 | 分类号: | G01S7/38 |
代理公司: | 郑州大通专利商标代理有限公司 41111 | 代理人: | 周艳巧 |
地址: | 450000 河*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 异步 多线程 方式 雷达 干扰 决策 方法 | ||
1.一种基于异步多线程方式的雷达干扰决策方法,其特征在于,包含如下内容:
构建与多功能雷达环境进行交互的干扰机模型,所述干扰机模型包含:若干干扰线程及全局网络,其中,所述干扰线程利用策略网络从干扰库中选取指定时刻作用于雷达的干扰样式,并利用价值网络对雷达任务状态转变过程中干扰样式进行有效性分析,全局网络对各干扰线程中策略网络和价值网络参数进行汇总分发来更新全局网络参数;
通过干扰机模型干扰目标方多功能雷达认知来实现实时对抗防御。
2.根据权利要求1所述的一种基于异步多线程方式的雷达干扰决策方法,其特征在于,干扰线程中,策略网络π(at|st;θ)通过计算指定时刻t下雷达任务状态st所采取干扰样式动作at的概率分布并基于概率分布从干扰库中选取干扰样式,其中,θ表示策略网络参数。
3.根据权利要求1或2所述的一种基于异步多线程方式的雷达干扰决策方法,其特征在于,利用价值网络V(st;θv)获取指定时刻t下雷达任务状态st执行干扰样式动作at的值函数,依据值函数及干扰样式回报值构造优势函数,通过引入优势函数来评价状态动作对(雷达任务状态st,干扰样式动作at)的优势,其中,干扰样式回报值通过当前时刻雷达状态及下一时刻下采取干扰样式动作时雷达任务状态前后变化的即时奖励及衰减因子来获取,θv表示价值网络参数。
4.根据权利要求3所述的一种基于异步多线程方式的雷达干扰决策方法,其特征在于,优势函数表示为:其中,n表示最大迭代次数,rt表示干扰样式动作at下雷达任务状态前后变化的即时奖励,γi表示迭代轮次i下的衰减因子。
5.根据权利要求3所述的一种基于异步多线程方式的雷达干扰决策方法,其特征在于,干扰样式动作at下雷达任务状态前后变化的即时奖励rt表示为:其中,Tn→Tend表示雷达威胁等级Tn转变至最低Tend的状态,Tn→Tn表示雷达威胁等级维持不变,Tn→Tn-i表示雷达威胁等级升高i个等级,Tn→Tn+i则表示雷达威胁等级降低i个等级。
6.根据权利要求4所述的一种基于异步多线程方式的雷达干扰决策方法,其特征在于,各干扰线程中,利用网络参数的迭代更新机制并通过判断采取干扰样式时刻下雷达任务状态对应的雷达威胁等级是否处于威胁等级最低状态或迭代次数是否满足最大迭代次数来结束迭代轮次,并将最后迭代过程中干扰线程的网络参数至全局网络,以利用全局网络对各干扰线程上传的网络参数进行汇总后并分发至各干扰线程网络中。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军战略支援部队信息工程大学,未经中国人民解放军战略支援部队信息工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111592778.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:结合RPA和AI的服务接口的配置方法及装置
- 下一篇:一种拖把清洁桶