[发明专利]一种基于深度神经网络的多视SAR图像目标识别方法有效
申请号: | 201510873282.0 | 申请日: | 2015-12-02 |
公开(公告)号: | CN105512680B | 公开(公告)日: | 2019-01-08 |
发明(设计)人: | 王鹏波;李轩;李春升;门志荣 | 申请(专利权)人: | 北京航空航天大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/08 |
代理公司: | 北京永创新实专利事务所 11121 | 代理人: | 赵文颖 |
地址: | 100191*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于深度神经网络的多视SAR图像目标识别方法,包括图像预处理、基于CAE的特征提取、基于RNN的多视SAR图像识别三个步骤。首先对输入图形进行裁剪,能量归一化等预处理过程,然后通过对CAE进行无监督训练提取到原始图像的特征,而后先利用上述特征构建多视SAR图像特征序列。之后,用训练集特征序列对RNN进行有监督训练。训练完成后,RNN可用于对测试集特征序列进行识别。本发明能充分利用CNN在学习和提取图像概括性特征方面的能力,及RNN充分提取序列上下文关系的能力,从而有效的提高了多视SAR图像目标的识别率,具有较高的工程价值。 | ||
搜索关键词: | 一种 基于 深度 神经网络 sar 图像 目标 识别 方法 | ||
【主权项】:
1.一种基于深度神经网络的多视SAR图像目标识别方法,包括以下步骤:步骤一、对输入的训练集图像和测试集图像进行尺寸裁剪,能量归一化预处理过程;(1)以原始图像的目标中心为中心进行裁剪,仅保留原图中目标的部分;(2)对裁剪后的图像进行能量归一化处理
其中式(1)中,x(i,j)表示原图中(i,j)像素点的原始值,m为原图中各个像素点的均值,σ为原图中各个像素点的均方差,
为经过归一化后的图像中(i,j)像素点的值;步骤二、构建包含卷积层和降采样层的卷积稀疏自编码器CAE,并采用类似于稀疏自编码器SAE的无监督训练方法对CAE进行无监督训练,利用完成训练的CAE提取原始图像的特征,并对提取到的特征进行降维处理;(1)初始化CAE;建立含有卷积层L层,降采样层L层的CAE,其中,卷积层与降采样层交替排列,设第k层卷积层和第k层降采样层所含子图个数为Mk;(2)构建训练所用输入数据Xdata;设输入图像的尺寸为n1×n1,个数为N1,第1层卷积层单元的局部感知域尺寸为m1×m1,卷积层的子图个数为M1,构建尺寸为m12×N1(n1‑m1+1)2的原始输入数据矩阵X;运用m1×m1的矩形窗在原始图像上进行滑动,遍历整个图像;同时,将矩形窗在各个位置所对应的窗内原始图像数据转换为向量,构成X中的某一列;随机分配该向量在X中的位置;选取X中的某些列,构建训练所用的输入数据Xdata;(3)构建SAE;输入层节点的个数为输入数据Xdata中数据的维度m12,隐含层节点的个数为卷积层的子图个数M1,输出层节点的个数为与输入层相同,隐含层和输出层根据下式获得;hi=f(Wxi+b1) (2)yi=f(Uhi+b2) (3)其中,xi表示Xdata中的第i列,作为输入数据;hi为隐含层节点的值;yi为输出层节点的值,W为隐含层与输出层之间的转移矩阵,U为隐含层与输出层之间的转移矩阵,b1,b2分别为隐含层和输出层偏置向量,W,U的初始值在
的范围中随机选择,b1,b2的初始值为0;f()为sigmoid函数,即
(4)无监督训练SAE;无监督训练的目标函数为
其中N表示Xdata中的数据个数,β为稀疏准则的权重,ρ稀疏参数,ρj为隐含层第j个节点的平均值,KL()表示KL散度,λ为权值衰减参数;第一项表示输入和输出的差别,第二项表示对隐含层提取到的特征进行稀疏性限制,最后一项表示对网络参数值的惩罚项;以式(4)为目标函数,采用L‑bfgs优化方法对网络参数进行更新,直至网络收敛为止;(5)卷积和降采样操作;第1层卷积层中子图的尺寸为(n1‑m1+1)×(n1‑m1+1),子图k中第(i,j)个点的取值ck(i,j)为:
其中,x(i,j)为由原始图像中由(i,j),(i+m1‑1,j),(i,j+m1‑1),(i+m1‑1,j+m1‑1)所限定的m1×m1的区域转化为的m12×1的向量,wk为第k个子图的权重,为第(3)步中获得的W矩阵中的第k行,b1(k)为第k个子图的偏置,为第(3)步中获得的b1向量中的第k个元素;降采样层的子图个数与前一层卷积层的子图个数相同,设第1层降采样层中单元对应的局部感知域大小为p1×p1,不同单元对应的局部感知域不重叠,降采样层的子图k中第(i,j)个点的取值sk(i,j)为:
如果构建的CAE中卷积层和降采样层的个数等于1时,则直接进行第(7)步,否则执行第(6)步;(6)对下一层卷积层和降采样层进行无监督训练;设第k层降采样层的子图尺寸为nk×nk,子图个数为Mk‑1,原始输入图像个数为N,下一层卷积层单元的局部感知域尺寸为mk×mk,子图个数为Mk,构建尺寸为Mk‑1mk2×N(nk‑mk+1)2的原始输入数据矩阵Xk;运用mk×mk的矩形窗在上一层降采样层中的各个子图上滑动后,遍历整个子图;同时,将矩形窗在各个子图同样位置所对应的窗内子图数据合并为一个向量,构成Xk中的某一列;随机分配该向量在Xk中的位置;选取Xk中的某些列,构建训练所用的输入数据Xdata;将Xdata作为SAE的输入,重复第(2)~(6)步,逐层训练,直至训练完(1)步中构建的CAE中的所有层;(7)获取图像特征;设最后一层降采样层的子图尺寸为nL×nL,子图个数为NL;将每个子图都转化为nL2×1的向量,并将这NL个向量拼接为尺寸为NLnL2×1的向量;对该向量采用PCA方法,进行降维处理,获得图像特征;步骤三、采用步骤二中获取到的特征,构建多视SAR图像特征序列,对循环神经网络RNN进行有监督训练,完成训练后,利用该RNN对测试集数据进行识别;(1)构建多视SAR图像特征序列;根据SAR图像的视角信息,将具有固定视角间隔的多幅属于同一目标的SAR图像利用步骤二所提取到的特征进行组合,得到多视SAR图像特征序列;假设共构建了N个序列,每个序列中共含有M个图像特征;(2)初始化RNN;设置RNN的输入层左半部节点数与输入特征的维数相同,RNN的输入层右半部节点数与RNN中隐含层的节点数相同,输出层节点数与待分类的类别数相同,每个节点与一种类别相对应;设利用步骤二获得的特征维数为m,RNN的隐含层节点个数为u,输出层节点数为n,则RNN的输入层含有m+u个节点;RNN中相邻两层间的转移矩阵的初始值随机获得,服从标准正态分布;各偏置向量中每个单元的初始值为0;利用步骤(1)中获得的多视SAR图像特征序列作为RNN的输入;设此时输入的特征为xt此时,第1层隐含层节点的取值ht,由式(7)获得ht=f(W1xt+W2ht‑1dh) (7)其中,ht‑1为序列中前一特征对应的隐含层节点值,令当t=1时,序列中前一特征所对应的隐含层取值h0中每个单元的值为0;W1为当前时刻输入与隐含层之间的转移矩阵,W2为序列中前一特征对应的隐含层取值与此时隐含层之间的转移矩阵,dh为隐含层所对应的偏置向量,f()为sigmoid函数;输出层节点中第k个节点的值
由式(8)获得
其中,W3为隐含层与输出层之间的转移矩阵,do为输出层所对应的偏置向量;ht为当前时刻隐含层节点的值;w3(k)为W3矩阵中的第k行,do(k)为do向量中的第k个单元;将序列中下一特征xt+1和通过式(7)得到的ht输入到RNN中,重复执行本步,直至处理完序列中所有特征为止;(3)有监督训练RNN;网络有监督训练的目标函数为:
其中,N为序列个数,M为序列中图像特征个数,yij表示第j个序列中第i个特征对应的输出结果,pij为对应特征的标注,设该特征属于第k类,则pij中第k个单元值为1,其他单元值为0,λ为权值衰减参数;
为矩阵W的Frobenius范数;采用BPTT的更新策略训练RNN,并用共轭梯度法对网络参数进行更新,直至收敛为止;(4)利用RNN进行识别对测试集图像构建具有与训练集相同视角间隔的多视SAR图像特征序列,将该序列代入式(7)~(8),得到网络的输出yavg;
其中yi表示序列中第i个特征对应的网络输出;取出yavg中最大的值,设yavg中第k个单元值yavg(k)为yavg中的最大值,则测试图像属于第k类。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学,未经北京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510873282.0/,转载请声明来源钻瓜专利网。