[发明专利]一种雷达自适应行为Q学习方法在审
申请号: | 201510729398.7 | 申请日: | 2015-10-31 |
公开(公告)号: | CN105388461A | 公开(公告)日: | 2016-03-09 |
发明(设计)人: | 彭晓燕;杨金金;袁晓垒;张花国 | 申请(专利权)人: | 电子科技大学 |
主分类号: | G01S7/02 | 分类号: | G01S7/02 |
代理公司: | 成都点睛专利代理事务所(普通合伙) 51232 | 代理人: | 葛启函 |
地址: | 611731 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 雷达 自适应 行为 学习方法 | ||
1.一种雷达自适应行为Q学习方法,其特征在于,包括如下步骤:
S1、学习方通过不断发射探测干扰信号,迫使目标雷达改变发射信号,学习方接收端获得目标雷达下次的发射信号,用于健全学习方的动态波形库,所述健全学习方的动态波形库的具体方法为:将学习方接收端得到的波形信息和已知波形进行对比,若动态波形库中没有该波形,则存入动态波形库,然后继续发射探测干扰信号,直到m次交互中得到的目标雷达发射波形均可在动态波形库中找到为止,其中,m为经验值;
S2、以时域最小互信息量准则下的波形选择为学习对象,对其进行建模,并利用建模的对象与学习方进行交互,得到不同干扰下的波形转变情况即实验室训练数据;
S3、利用S2所述训练数据进行贝叶斯网络参数学习,利用Matlab环境下的贝叶斯工具箱,加入狄利克雷先验分布,得到新的雷达波形的最大后验概率表即贝叶斯记录表,其中,贝叶斯记录表是指现波形、现干扰信号下具有最大后验概率的新波形编号;
S4、在原来Q学习算法的基础上,以S3所述贝叶斯记录表为先验知识,根据贝叶斯表更新算法进行迭代学习,并给出学习结果。
2.根据权利要求1所述的一种雷达自适应行为Q学习方法,其特征在于:S2所述建模的具体方法为:
S21、当目标雷达波形选择准则为最小互信息量准则,雷达回波信号建模为b=a+w=Sα+w,其中,S为包含波形参数的波形卷积矩阵,α为散射系数向量,w为接收机噪声向量;
S22、进行波形选择,具体为:保证下一次发送的波形能获得更多的新信息量,即前后两次雷达回波信号的互信息量最小,即
S23、对S22所述的波形选择对象进行建模,以信号波形雷达、带宽等参数来表征不同的雷达波形状态,选择波形库中与上一发射波形互信息量最小的波形作为新的雷达波形状态;
S24、设置不同的干扰信号,影响目标雷达的波形选择,以此不断进行交互,则得到不同干扰下的波形转变情况即实验室训练数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510729398.7/1.html,转载请声明来源钻瓜专利网。