[发明专利]一种雷达自适应行为Q学习方法在审
申请号: | 201510729398.7 | 申请日: | 2015-10-31 |
公开(公告)号: | CN105388461A | 公开(公告)日: | 2016-03-09 |
发明(设计)人: | 彭晓燕;杨金金;袁晓垒;张花国 | 申请(专利权)人: | 电子科技大学 |
主分类号: | G01S7/02 | 分类号: | G01S7/02 |
代理公司: | 成都点睛专利代理事务所(普通合伙) 51232 | 代理人: | 葛启函 |
地址: | 611731 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明属于雷达信号处理领域,尤其涉及基于贝叶斯表更新的Q学习方法对雷达自适应行为的学习、辨识问题。本发明提供一种雷达自适应行为Q学习方法,用改进的Q学习算法针对时域波形选择行为(最小互信息量准则)进行学习,在传统只根据接收端得到的直接信息进行干扰的基础上跃进一大步,利用所提出的机器学习算法对雷达时域自适应行为进行辩识,并给出一定的学习结果。本发明的方法首次将基于贝叶斯表更新的Q学习算法应用到雷达行为学习与辨识问题中,相对于现有技术在时域波形选择(最小互信息量准则)下的学习效果更优。 | ||
搜索关键词: | 一种 雷达 自适应 行为 学习方法 | ||
【主权项】:
一种雷达自适应行为Q学习方法,其特征在于,包括如下步骤:S1、学习方通过不断发射探测干扰信号,迫使目标雷达改变发射信号,学习方接收端获得目标雷达下次的发射信号,用于健全学习方的动态波形库,所述健全学习方的动态波形库的具体方法为:将学习方接收端得到的波形信息和已知波形进行对比,若动态波形库中没有该波形,则存入动态波形库,然后继续发射探测干扰信号,直到m次交互中得到的目标雷达发射波形均可在动态波形库中找到为止,其中,m为经验值;S2、以时域最小互信息量准则下的波形选择为学习对象,对其进行建模,并利用建模的对象与学习方进行交互,得到不同干扰下的波形转变情况即实验室训练数据;S3、利用S2所述训练数据进行贝叶斯网络参数学习,利用Matlab环境下的贝叶斯工具箱,加入狄利克雷先验分布,得到新的雷达波形的最大后验概率表即贝叶斯记录表,其中,贝叶斯记录表是指现波形、现干扰信号下具有最大后验概率的新波形编号;S4、在原来Q学习算法的基础上,以S3所述贝叶斯记录表为先验知识,根据贝叶斯表更新算法进行迭代学习,并给出学习结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510729398.7/,转载请声明来源钻瓜专利网。