[发明专利]结合双边滤波的三维卷积神经网络高光谱影像分类方法在审
申请号: | 201910041387.8 | 申请日: | 2019-01-16 |
公开(公告)号: | CN109766858A | 公开(公告)日: | 2019-05-17 |
发明(设计)人: | 江天;彭元喜;刘煜;侯静;张峻;郝昊;李寅;苏茗芮;陶梓隆;孙豪 | 申请(专利权)人: | 中国人民解放军国防科技大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/40;G06K9/62 |
代理公司: | 国防科技大学专利服务中心 43202 | 代理人: | 王文惠 |
地址: | 410073 湖*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明属于信息处理技术领域,公开了结合双边滤波的三维卷积神经网络高光谱影像分类方法。本发明首先使用双边滤波器对高光谱影像进行处理,再进行数据归一化;然后从处理后的高光谱影像中提取以待分类像元为中心的一定邻域内的数据块作为输入端数据,以待分类像元所属标签为对应数据块的标签,生成训练数据和测试数据;构造三维卷积神经网络,对其开展训练和测试;最后使用经过训练的三维卷积神经网络完成对高光谱影像的空‑谱联合分类。本发明充分利用高光谱影像的空‑谱信息,提高了分类精度;引入双边滤波算法,提高了分类任务的准确率,缩短、降低了训练具备同等分类精度的模型的时间、功耗;解决了现有技术分类精度低、耗时长的问题。 | ||
搜索关键词: | 高光谱 卷积神经网络 分类 双边滤波 三维 影像 影像分类 数据块 像元 标签 信息处理技术 数据归一化 双边滤波器 测试数据 技术分类 训练数据 输入端 准确率 功耗 邻域 算法 耗时 测试 引入 联合 | ||
【主权项】:
1.结合双边滤波的三维卷积神经网络高光谱影像分类方法,其特征在于:该方法包括如下步骤步骤S1:使用双边滤波器对高光谱影像数据进行边缘保持滤波,去除无关噪声,并保持边缘信息,同时将数据的光谱信息和空间信息融合起来;具体操作为:输入高光谱影像数据,对其所有波段处的图像使用双边滤波器进行滤波,其中,双边滤波器的计算公式为:
式中,I是某一波段处的原始图像;Ifiltered是该原始图像经过双边滤波后的结果;x是当前进行滤波的像素,I(x)是像素x处的幅度值;Ω是以像素x为中心的具有一定范围的滤波窗口;xw是滤波窗口Ω内的某一像素,I(xw)是像素xw处的幅度值;gs(||xw‑x||)是空间域核函数,fr(||I(xw)‑I(x)||)是像素幅值域核函数,二者均采用高斯函数形式;设像素x和xw的空间坐标分别为(i,j),(k,l),则对像素x进行双边滤波时,滤波窗口Ω中像素xw的权重系数为:
其中,I(i,j),I(k,l)分别是像素x=(i,j)和xw=(k,l)处的幅度值;σd和σr分别是空间域和像素幅值域的sigma平滑参数;通过对滤波窗口Ω中不同像素的加权平均,中心像素x=(i,j)经过双边滤波后的幅值为:
通过改变Ω的直径、平滑参数σd和σr可以调节双边滤波器对高光谱影像的滤波效果;步骤S2:对双边滤波后的高光谱影像进行归一化处理,其中,归一化处理过程中的归一化公式为:
式中xijd和
分别代表归一化处理前后的高光谱影像数据;(i,j)代表高光谱影像像素的空间位置坐标;d代表高光谱影像的第d个波段;xmax和xmin分别代表三维高光谱影像数据中的最小值和最大值;a和b均为常数,使得归一化后的数值在(0,1)范围内,且不包括0和1;步骤S3:生成训练数据和测试数据;步骤S3分为两步操作,具体如下:(3a):对高光谱影像空间域的边沿进行扩充,扩充的宽度为
使其维度由(H,W,L)扩展成为
边沿扩展层的数值均为0;(3b):提取以待分类像元为中心的m×m×L邻域范围内的数据块Hm×m×L作为输入端数据,并以待分类像元所属标签为对应数据块的标签,生成大量维度为m×m×L的带标签的数据块,作为训练数据和测试数据;其中,(H,W,L)分别代表高光谱影像空间域的长、宽值和光谱域的光谱通道数;m代表数据块在空间域的长宽值;步骤S4:从步骤S3提取出来的带有标签的数据块中随机抽取一半或更少的数据块作为三维卷积神经网络的训练数据,其余作为测试数据;步骤S5:设计并搭建基于三维卷积神经网络的分类模型;其中,网络整体由4大层构成,其结构为:输入层→3D‑CNN层→全连接层→输出层,三维卷积神经网络各层的具体结构及构建步骤如下所示:(5a):输入层,输入维度为m×m×L的高光谱数据块,其中m代表数据块在空间域的长宽值,L代表高光谱影像在光谱域的光谱通道数;(5b):3D‑CNN层,用于提取高光谱影像的光谱特征和空间特征;(5c):全连接层,3D‑CNN层的输出进入全连接层,将3D‑CNN层学习到的特征映射到样本的标记空间中,即将3D‑CNN输出的三维特征立方体转化成一个一维向量;(5d):输出层,全连接层的输出进入输出层;输出层使用Softmax分类器对全连接层输出的一维向量进行处理,得到不同类别的概率,选取概率最大的类别作为预测结果;其中,Softmax分类器的假设函数是:
其中,x代表分类层的输入数据;y∈{1,...,N},是输入数据的类别标签;N代表类别总数;θ代表模型参数,θ(j)代表第j类物体的模型参数;P(y=j|x;θ)代表第j类物体的概率;步骤S6:利用训练数据训练网络,利用测试数据进行检验;具体步骤如下:(6a):利用步骤S4得到的训练数据对步骤S5设计并搭建的三维卷积神经网络分类模型进行训练,采用随机梯度下降算法训练网络参数,参数更新公式为:
其中,l代表迭代次数;α表示学习速率;
为交叉熵损失函数,用来计算模型预测标签与真实标签之间的误差;如果训练样本集中有K组数据和标签{(x(i),y(i));i=1,...,K},那么交叉熵损失函数的计算公式为:
其中,y(i)代表第i个输入数据的真实标签,Y(i)是第i个输入数据的预测标签,N代表类别总数,通过最小化
就可以得到模型的最优参数;(6b):将测试数据输入训练好的三维卷积神经网络分类模型,对模型的分类效果进行检验;步骤S7:将待分类数据输入三维卷积神经网络分类模型,完成对高光谱影像的全波段光谱‑空间联合分类。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军国防科技大学,未经中国人民解放军国防科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910041387.8/,转载请声明来源钻瓜专利网。