[发明专利]一种基于散射机制多通道扩张卷积神经网络的极化SAR地物分类方法有效
申请号: | 202110365566.4 | 申请日: | 2021-04-06 |
公开(公告)号: | CN113392871B | 公开(公告)日: | 2023-10-24 |
发明(设计)人: | 周勇胜;王亚楠;程建达;张帆;尹嫱;项德良;马飞;洪文 | 申请(专利权)人: | 北京化工大学 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/82;G06V20/10;G06N3/0464;G06N3/082 |
代理公司: | 北京思海天达知识产权代理有限公司 11203 | 代理人: | 沈波 |
地址: | 100029 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 散射 机制 通道 扩张 卷积 神经网络 极化 sar 地物 分类 方法 | ||
1.一种基于散射机制多通道扩张卷积神经网络的极化SAR地物分类方法,其特征在于:该方法的实施流程如下:
步骤1、数据预处理:
对PolSAR数据滤波、特征提取;
S1.1将PolSAR数据进行5×5的Lee滤波;
S1.2利用Freeman-Durden分解方法特征提取;
在全极化观测中,用于发送和接收的方式是线性水平和垂直极化,则极化后向散射矩阵[S]表示为:
H和V代表极化方式,H表示水平方向极化,V表示垂直方向极化;SHH表示水平方向发射水平方向接收的极化回波数据,SVV表示垂直方向发射垂直方向接收的极化回波数据;SHV表示水平方向发射垂直方向接收的极化回波数据,SVH表示垂直方向发射水平方向接收的极化回波数据;
将S矩阵进行变换得到极化SAR数据的另一种表示形式,极化协方差矩阵C;首先将S矩阵向量化得:
式中,[]T表示矩阵转置;然后,将此向量跟自身的共轭转置矩阵相乘就可得到极化协方差矩阵:
完整的协方差矩阵表示为:
其中,()*表示这个数据的共轭,<>表示按照极化视数取平均值;
将目标的极化协方差矩阵C分解为3种基本散射分量之和,过程如公式(2)所示:
式中,[C]s对应表面散射,[C]d对应二面角散射,[C]v对应体散射;fs对应着布拉格表面散射分量的贡献,fd对应着二面角散射分量的贡献,fv对应着体散射分量的贡献;β时表示HH后向散射与VV后向散射的比值,α被定义为α=RghRvh/RgvRvv,其中Rgh和Rgv分别表示地表的水平和垂直Fresnel系数,Rvh和Rvv表示竖直墙体的Fresnel系数;
Freeman-Durden分解的主要思路则是将极化协方差矩阵C分解为三种主要的散射机理,即面散射、二面角散射和体散射,其表现形式为:
其中,fs,fd,fv分别对应面散射、二面角散射和体散射分量,Ps,Pd,Pv则对应着每个分量的散射功率;
步骤2、样本的划分:
在训练网络模型之前,需要划分数据样本:从所有标记样本中随机选取一定比例的训练样本,剩余标记样本作为测试样本;
步骤3、构建基于散射机制的多通道卷积神经网络:
S3.1网络结构
基于散射机制的多通道卷积神经网络由3个扩张卷积神经网络Dilated-CNN通道组成;为保证每个通道对最终的结果贡献相同,每个通道的结构设计相同,输入的数据尺寸大小也相同;每个通道的输入都为尺寸为15×15大小的一维特征的patch块,每个通道包含三个扩张卷积层和一个最大池化层;扩张卷积层包含三个操作:扩张卷积、批量归一化BN、修正线性单元ReLU函数;每个扩张卷积层内核包含3×3个非零权重,第一个卷积层有64个滤波器,膨胀因子为1;第二个卷积层有128个滤波器,膨胀因子为2;第三个卷积层有256个滤波器,膨胀因子为5;每个卷积层后面都有一个BN层,每一个卷积层的激活函数均为ReLU函数,最后一层是pool_size为2×2的最大池化层;将通过三通道提取得到的高级特征级联得到最终的特征输出;接着将输出的特征展开为一个1维张量再用全连接层将这个张量进一步抽象为一个1维长度为1024的特征张量,再通过一个全连接层变为一个1维长度为512的特征张量;再将该特征张量输入到一个全连接层中,全连接层使用Softmax函数激活,输出每一类预测的概率;
S3.2损失函数
交叉熵作为损失函数loss的表达式如式(1)所示,其中y为标签,为预测值,n为一个训练批次的样本总量,i为从1到n的样本下标;
S3.3优化器
使用AdaDelta优化器来更新网络中的参数,将学习率设置为0.1;AdaDelta算法结合AdaGrad和RMSProp两种算法,在模型训练的初期和中期,训练速度快;AdaDelta算法策略如式(8)所示:
其中Wt为第t次迭代的模型参数,gt=ΔJ(Wt)为代价函数关于W的梯度;E[g2]t表示前t次的梯度平方的均值;表示前t-1模型参数每次的更新步长累加求根;
步骤4、训练网络模型:
网络的训练流程如下所示:
S4.1对网络参数初始化
S4.2开始进行一轮迭代,把一个批次的PolSAR图像数据训练样本输入到三通道网络中,经过网络的前向计算得到输出结果;
S4.3使用自定义损失函数得到本次迭代的损失,通过梯度求导的链式法则,将损失反向传播到网络的每一通道每一层得到该层权重W和偏置b的梯度,通过AdaDelta优化函数更新网络参数;
使用交叉熵和平均交叉熵相结合的新的损失函数;考虑到样本不平衡的问题,根据样本数量的先验概率为均匀分布的交叉熵加入一个权重系数,定义的新的损失函数如公式(4)所示;
前向传播最后输出一个预测值,将这个预测值和真实值用定义的损失函数来计算误差,然后将误差进行反向传播至每一个网络通道中,利用链式法则对权重求偏导数,然后对各个权重进行更新;最后通过AdaDelta优化函数更新网络参数;
S4.4回到S4.2进行下一个批次的迭代,直到所有的批次全都完成计算即为完成一轮迭代;
设置训练任务的迭代次数和模型保存的准确率阈值,然后网络不断的迭代训练,更新权重;每次迭代都输出损失函数,并且每次迭代输出当前迭代次数和损失函数;
S4.5重复以上步骤S4.1-S4.4,最后一直训练到达到满足迭代停止条件,保存最优的模型;训练过程中保存loss和accuracy的迭代值,存储后并输出;
步骤5、PolSAR图像地物分类:
在基于散射机制的多通道神经网络的训练完成之后,得到训练后的最优模型,在测试时加载模型;在对测试样本进行分类时,先将测试样本按照散射机制划分为三个特征通道数据,将三组数据分别输入网络的三通道中,得到分类结果概率矩阵,根据one-hot反编码得到最终的分类结果,保存分类结果并统计分类的准确率并在命令行显示。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京化工大学,未经北京化工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110365566.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种公路货车及其轮轴识别方法
- 下一篇:电子系统加速因子评定方法