[发明专利]面向小样本残差学习的合成孔径雷达目标识别方法有效
申请号: | 201811263252.8 | 申请日: | 2018-10-28 |
公开(公告)号: | CN109492556B | 公开(公告)日: | 2022-09-20 |
发明(设计)人: | 张帆;傅真珍;赵鹏;尹嫱;胡伟 | 申请(专利权)人: | 北京化工大学 |
主分类号: | G06V20/13 | 分类号: | G06V20/13;G06V10/774;G06V10/84;G06V10/82;G06N3/04;G06N3/08 |
代理公司: | 北京思海天达知识产权代理有限公司 11203 | 代理人: | 沈波 |
地址: | 100029 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 面向 样本 学习 合成孔径雷达 目标 识别 方法 | ||
1.面向小样本残差学习的合成孔径雷达目标识别方法,其特征在于:该方法的步骤包括:
步骤(1)划分好SAR图像的训练集和测试集并进行图像剪裁和归一化处理;
步骤(2)构建加入了Dropout的残差结构,并搭建18层的残差网络模型;
步骤(3)用Center Loss损失函数来对网络倒数第二层输出的特征的类内距离进行约束,用Softmax Loss对经过网络最后的Softmax层的输出进行约束;将两个损失函数的损失结果进行加权作为最后的整体损失来监督步骤(2)中所构建的残差网络模型进行训练;
步骤(4)对网络的参数进行初始化,并选网络的优化函数;
在步骤(1)中,对于训练集的目标图像先剪裁出中心尺寸为H1×W1的部分即高×宽,之后随机剪裁出尺寸为H2×W2的图像,这样的裁剪使目标具了有位移性,进而使训练出的网络更具鲁棒性;对于测试集的图像只裁剪出H2×W2的中心目标区域;之后使数据集图像中的每个像素点的像素值都除以255,从而将图像的像素值压缩到0-1之间;
在步骤(2)中,构建网络模型时选择了18层的残差网络作为基础网络,并在构建残差块时引入了Dropout层;假设有两个深度不同的网络,深层网络前面的结构与浅层网络一致,后面的结构由不改变输出的线性层构成,那么这两个网络的性能也应该是一样的;使用残差网络作为主体网络结构;
残差学习的模块结构是引入了快捷连接,即输入被直接连接到块的输出上,层的输出被定义为:
y=F(x,{Wi})+x (1)
x为层的输入,y为层的输出,Wi为主干支路上可训练的权值,F(x,{Wi})为需要学习的映射关系;
模块中主干支路的映射关系F(·)由多个卷积层构成,在每个卷积层后面会连接批标准化层和修正线性单元;
BN层的作用是对上一个卷积层的输出进行标准化来调整数据的分布再传入下个层,从而降低了权值初始化的成本并使网络能更快速的收敛;BN的计算公式如下:
其中m表示当前训练的批次大小,xi为当前输入的值;公式(2)是在对当前的输入求取均值和方差;是对xi进行标准化后的输出;由于标准化后的数值服从均值为0方差为1的高斯分布,这样大部分的值便落在了非线性激活函数的线性区内,这会造成网络性能的退化;因此BN层会通过公式(4)对标准化后的值再进行一次扩展和平移的修正,其中γ是扩展参数,β是平移参数,这两个参数为可训练的参数,作用是自适应的调整标准化的强度;
由于输入数据大都是非线性的,普通的线性映射并不能将其很好地划分,因此需要使用非线性激活函数来赋予网络非线性的特性;ReLU是一种非线性激活函数,表达式为:f(x)=max(0,x),即对于小于0的输入抑制,对于大于0的输入保留;这种激活函数使深层的网络能够收敛,其赋予网络的稀疏性缓解过拟合,并能加快训练速度;
式(1)需要x与F(x,{Wi})的维度一致,若出现了不一致的情况,在F(·)的映射过程中改变了数据的通道数或尺寸,通过对输入x使用1×1的卷积操作来将其转换为与输出相匹配的维度;这时的输出表示为:
y=F(x,{Wi})+Wsx (5)
在残差块主干支路中的两个卷积层之间引入了Dropout层,并将保留概率设置为0.2;使用的网络的主体也是由具有不同特征图数量的该残差模块堆叠而成;构建好基础残差结构后便开始搭建网络模型;首先将输入图像接入一个卷积层来增加通道数并进行滤波,将卷积层的步长(stride)设置为1,填充(padding)也设置为1,即在进行卷积操作之前先为特征图的四周填充一圈0,从而使得卷积后特征图尺寸不变;
网络的中间部分由4个具有相似结构的残差卷积模块堆叠而成,每个模块由2个残差结构连接而成;在每个模块的第一个残差结构中,第一个卷积层的步长都被设置为2来将图像的尺寸缩减为原来的二分之一,同时将卷积核的个数设置为原来的2倍从而使输出的特征图数量为原来2倍;而相应残差结构的shortcut支路上也需要进行一个步长为2的1×1卷积操作来将其转换为与输出相匹配的尺寸和维度,此时特征图不做填充;除了每个模块的第一个残差结构的第一个卷积层外,中间部分的其他的卷积层的步长和填充都被设置为1,且每个模块中的第二个残差结构的shortcut支路恢复为恒等映射;每当数据传递到下一个模块的时候,特征图的数量增大到原来的2倍的同时尺寸会缩小一半;
网络中间部分的第4个模块的后面连接了一个全局平均池化层用来综合每个特征图的特征;网络的末尾使用了一个全连接层来进行分类;最后使用Softmax层将输出结果映射到[0,1]区间内且使其总和为1,从而得到样本属于每一个类别的概率值;Softmax的表达式为:
其中,Vi表示向量V的第i个元素,K为V的整体维度,Si为Vi经过Softmax层后的输出。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京化工大学,未经北京化工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811263252.8/1.html,转载请声明来源钻瓜专利网。