[发明专利]基于强化学习与蒙特卡洛搜索树的MIMO雷达布站方法有效
申请号: | 202110437632.4 | 申请日: | 2021-04-22 |
公开(公告)号: | CN113128121B | 公开(公告)日: | 2022-05-31 |
发明(设计)人: | 余晨;李昊;杨益川 | 申请(专利权)人: | 中国电子科技集团公司第二十九研究所 |
主分类号: | G06F30/27 | 分类号: | G06F30/27;G06F17/18;G06N3/04;G06N3/08 |
代理公司: | 成都九鼎天元知识产权代理有限公司 51214 | 代理人: | 贾年龙 |
地址: | 610036 四川*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 强化 学习 蒙特卡洛 搜索 mimo 雷达 方法 | ||
1.基于强化学习与蒙特卡洛搜索树的MIMO雷达布站方法,其特征在于,包括步骤:
S1,对雷达天线布站区域进行离散化处理,获得该区域的栅格模型;在步骤S1中,能够根据栅格模型,获得当前布站状态s;
S2,以布站状态作为输入,利用深度神经网络输出相应参数,辅助蒙特卡洛搜索树进行搜索更新;在步骤S2中,深度神经网络以当前布站状态s作为输入,输出蒙特卡洛搜索树的节点价值和子节点概率(v,P)=fθ(s),其中θ表示深度神经网络参数,v表示蒙特卡洛搜索树节点价值,P表示蒙特卡洛搜索树节点概率;深度神经网络参数更新方式如下:
θ=θ-α·▽J
J=(z-v)2-π·logP+α·||θ||2
其中,z表示完成蒙特卡洛搜索树更新后节点所表示布站方式的监视性能函数,π表示蒙特卡洛搜索树更新后的节点搜索概率,α表示折扣因子,损失函数J由三个部分组成,监视性能均方误差(z-v)2、节点概率交叉熵π·logP和正则化项||θ||2;
S3,根据蒙特卡洛树的结果更新神经网络参数,最后通过训练好的神经网络指导雷达布站;在步骤S3中,蒙特卡洛搜索树获得深度神经网络提供的节点值v和子节点概率P后,对蒙特卡洛搜索树进行搜索;当搜索到叶节点,根据监视任务指标F0判断该叶节点的监视性能函数值v(s),如下:
其中Mr为随机布站满足监视任务指标的布站数量,m为当前布站数量,所有监视区域的性能指标函数F(s)表示为:
其中L表示整个监视区域的栅格数,φl(s)表示第l个栅格监视区域的监视性能指标函数,与信噪比的关系如下:
其中D0代表满足设计探测性能的探测因子;σi,j是针对第i个发射机和第j个接收机的目标RCS,σi,i是针对第i个发射机的目标RCS;Rti是从第i个发射机到第k个距离分辨单元的欧几里得距离;Rrj是从第j个接收机到第k个距离分辨单元的欧几里得距离;Rmax是雷达的最大探测距离。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国电子科技集团公司第二十九研究所,未经中国电子科技集团公司第二十九研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110437632.4/1.html,转载请声明来源钻瓜专利网。