[发明专利]一种基于多尺度深度特征的遥感影像分类方法在审
申请号: | 201910314919.0 | 申请日: | 2019-04-18 |
公开(公告)号: | CN110084294A | 公开(公告)日: | 2019-08-02 |
发明(设计)人: | 赵文智;陈家阁;柏延臣 | 申请(专利权)人: | 北京师范大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/46 |
代理公司: | 成都方圆聿联专利代理事务所(普通合伙) 51241 | 代理人: | 曹少华 |
地址: | 100875 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 多尺度 算法 遥感影像分类 影像金字塔 深度特征 影像特征 自动提取 卷积神经网络 神经网络算法 多尺度特征 地物目标 光谱特征 深度影像 训练样本 遥感影像 影像空间 自动构建 自动建立 自学习 影像 融合 高层 学习 | ||
1.一种基于多尺度深度特征的遥感影像分类方法,其特征在于,包括以下步骤:
首先,该算法将原始遥感影像进行光谱空间降维,得到信息压缩后的遥感影像主成分信息;
其次,将影像主成分信息进行多尺度拉普拉斯变换,建立多尺度影像金字塔,得到多尺度遥感影像信息;
进而,借助多尺度卷积神经网络算法,通过自学习方式自动提取遥感影像不同尺度上高层影像语义特征;
最后,将多尺度深度影像特征与光谱特征进行融合,从而实现遥感影像分类精度。
2.根据权利要求1所述的一种基于多尺度深度特征的遥感影像分类方法,其特征在于,具体的包括以下步骤:
一、光谱降维
利用主成分分析算法,将原始遥感影像数据降为3个光谱波段,同时保留95%以上的原始数据信息;
二、多尺度深度特征
多尺度卷积神经网络算法自动的将输入影像转化为多尺度图像金字塔,并通过多尺度训练样本提取机制对提取影像多尺度特征:
1.多尺度影像构建
建立多尺度训练样本,通过利用遥感影像的前M个主成分波段,构建尺度为S的拉普拉斯图像金字塔其中,图像金字塔在第一尺度即为原始输入影像Im,对后续尺度由其前一尺度构建而来;
2.卷积神经网络训练
对于遥感影像中的地面真实参照数据,以参照像素点为中心,截取一定大小的影像区域,并作为卷积神经网络的输入数据;假设从影像中随机选取了M个训练数据,则其对应的训练样本为Si,i∈(1,...,M),ti表示每个训练样本对应的类别标签,训练一个具有L层的卷积神经网络f(W,b|S),同时意味着在最小化损失函数的情况下学习卷积核参数W与偏置参数b.首先,对参数W和b设置初始值并初始化CNN,然后逐层进行特征提取与抽象,直至最后一层输出的预测类别为y,:
yi=WLHL-1+bL,i∈[1,2,...,M]
这里,yi为第i个训练样本Si通过卷积神经网络所得到的预测所属类别;根据预测类别与真实类别的差别,训练损失函数L定义如下:
为了最小化损失函数,采用后向传播算法,将预测误差L从最后一层逐层反馈到第一层,然后,根据每一层的误差大小进行参数的改正;采用梯度随机下降算法,对于l层的参数W和b来说,其对应的梯度修正项分别为和根据修正项对卷积神经网络中的参数进行改正,从而将损失函数优化;
3.多尺度特征提取
对于多类别分类任务,假设共有C个类别,N个多尺度随机选择的训练样本,表述为特别的,每个训练样本Xn可描述为由固定感受野p×p产生的图像方形区域,对应的中心点标签为t∈(1,2,...,C);
采用多尺度卷积神经网络算法f(k,b|X)的训练,其中,M个主成分波段用于构建S个尺度的图像金字塔,多尺度影像特征从多尺度训练样本中学习得到;学习具有L层的多尺度卷积神经网络,等同于在最优化损失函数的基础上学习其每层的滤波器参数k和偏置项b。因此,前向损失函数描述为:
其中,tn表示第n个训练样本Xn的类别标签,并且yn(k,b)表示利用多尺度卷积神经网络算法f(k,b|X)所得到的预测标签;在该算法中,第l隐含层描述为hl,l∈{1,...,L},特别的,h0表示原始输入数据;最终的输出结果表示为:
y(k,b)=g(aL),withaL=kLhL-1+bL
通过对比基于多尺度卷积神经网络的预测标签和参照标签则损失函数可以描述为δ=L(k,b);利用随机梯度下降的方法进行损失函数的优化及参数k和b的改正;最终,在s个尺度下,基于多尺度卷积神经网络的多尺度空间特征F可描述为:
F=f(k,b|X)=g(kX+b);
三、特征融合与影像分类
完成多尺度卷积神经网络网络的训练,利用基于多尺度卷积神经网络算法获取到的影像特征与光谱特征进行融合,即将所学习到的多尺度影像特征与光谱特征V=[v1,v2,...,vm]进行融合,其中vm表示第m个主成分对应的光谱值,融合后的特征表示为U=[F,V];基于融合特征,引入LR分类器对高分辨率遥感影像进行分类,对于每个训练样本及其对应的融合特征Um,其属于类别t的概率为:
预测的类别标签为可能性最大的类别;其中,w表示LR的可训练参数,并由损失函数定义与优化;损失函数可表示为:
这里,sign(·)表示指示器函数,也就是说,sign(true)=1或sign(false)=0。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京师范大学,未经北京师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910314919.0/1.html,转载请声明来源钻瓜专利网。