[发明专利]一种基于分层强化学习的雷达认知对抗方法在审
申请号: | 202211056596.8 | 申请日: | 2022-08-31 |
公开(公告)号: | CN115327489A | 公开(公告)日: | 2022-11-11 |
发明(设计)人: | 童真 | 申请(专利权)人: | 中国船舶集团有限公司第七二三研究所 |
主分类号: | G01S7/36 | 分类号: | G01S7/36;G06N20/00 |
代理公司: | 南京理工大学专利中心 32203 | 代理人: | 薛云燕 |
地址: | 225001 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 分层 强化 学习 雷达 认知 对抗 方法 | ||
1.一种基于分层强化学习的雷达认知对抗方法,其特征在于,包括以下步骤:
步骤1、将雷达认知对抗过程划分为上层宏观任务,确定雷达认知对抗过程中各宏观任务之间的连接关系;
步骤2、构建雷达认知对抗过程中的状态动作转移关系,关联雷达认知对抗过程中各任务相关的状态集合和对应的动作集合;
步骤3、通过贝尔曼方程将雷达认知对抗过程进行任务分解,得到动作价值函数、状态价值函数、完成函数;
步骤4、采用ε-greedy的方式进行雷达认知对抗的策略迭代,依概率ε进行随机策略探索,依概率1-ε根据动作价值函数,得到当前状态的最优对抗策略;
步骤5、通过深度优先搜索,进行雷达认知对抗的策略搜索,更新状态价值函数和完成函数,得到当前最优的动作价值函数;
步骤6、重复步骤4~步骤5,直到雷达认知对抗策略趋于收敛。
2.根据权利要求1所述的基于分层强化学习的雷达认知对抗方法,其特征在于,步骤1所述的将雷达认知对抗过程划分为上层宏观任务,确定雷达认知对抗过程中各宏观任务之间的连接关系,具体如下:
将雷达认知对抗过程的总体任务M0划分为上层宏观任务{M1,M2,...,Mi},确定雷达认知对抗过程中各宏观任务Mi之间的连接关系。
3.根据权利要求2所述的基于分层强化学习的雷达认知对抗方法,其特征在于,所述将雷达认知对抗过程的总体任务M0划分为上层宏观任务{M1,M2,...,Mi},确定雷达认知对抗过程中各宏观任务Mi之间的连接关系,具体如下:
步骤1.1、自顶向下进行雷达认知对抗过程的多层次任务划分,将雷达认知对抗的总体任务M0分解为态势感知任务M1、干扰决策任务M2、效能评估任务M3三个上层任务;
步骤1.2、将态势感知任务M1向下划分为包含信号处理基础操作的态势感知具体任务;
步骤1.3、将干扰决策任务M2向下划分为干扰策略推理任务M4、干扰资源调度任务M5和干扰实施任务M6三个子任务,然后将干扰策略推理任务M4向下分解为策略推理的基本动作,干扰资源调度任务M5向下分解为资源调度的基本动作,干扰实施任务M6向下分解为干扰实施的基本动作;
步骤1.4、将干扰效能评估任务M3向下划分为干扰效果评估的具体任务。
4.根据权利要求3所述的基于分层强化学习的雷达认知对抗方法,其特征在于,步骤2所述的关联雷达认知对抗过程中各任务相关的状态集合和对应的动作集合,具体如下:
构建雷达认知对抗过程中的状态动作转移关系,关联雷达认知对抗过程中各任务Mi相关的状态集合{sij|sij∈Si}和对应的动作集合{aij|aij∈Ai}。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国船舶集团有限公司第七二三研究所,未经中国船舶集团有限公司第七二三研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211056596.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种铁路信号联锁关系验证系统及方法
- 下一篇:多塞平血药浓度检测方法