[发明专利]一种从局部到全局上下文信息提取的高光谱影像分类方法有效
申请号: | 202110017089.2 | 申请日: | 2021-01-07 |
公开(公告)号: | CN112766099B | 公开(公告)日: | 2022-06-07 |
发明(设计)人: | 钟燕飞;胡鑫;王心宇 | 申请(专利权)人: | 武汉大学 |
主分类号: | G06V20/13 | 分类号: | G06V20/13;G06V20/40;G06K9/62;G06V10/764;G06V10/80 |
代理公司: | 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 | 代理人: | 王琪 |
地址: | 430072 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 局部 全局 上下文 信息 提取 光谱 影像 分类 方法 | ||
1.一种从局部到全局上下文信息提取的高光谱影像分类方法,其特征在于,包括如下步骤:
步骤1,对输入影像进行镜像填充;
步骤2,对镜像填充影像进行通道将维;
步骤3,构建高光谱影像分类网络模型,包括以下子步骤;
步骤3.1,使用局部注意力模块进行局部上下文信息提取,获得底层细节特征;
所述步骤3.1的实现方式如下,
步骤3.1.1,设步骤2中通道降维后得到特征图F,将特征图F输入第一个局部上下文信息模块中,提取局部上下文信息感知特征,其输出特征图公式如下:
上式中Conv1×1(·)表示1×1卷积;σ(·)表示sigmoid激活函数,输出每个像素的权重;strip(·)表示条带池化操作,对于输入特征图F的一个通道特征x∈RH×W,具体公式如下:
strip(x)=Expand(Conv1×1(stripH(x)))+Expand(Conv1×1(stripW(x)))
其中:表示纵向池化操作,表示横向池化操作,Conv1×1表示1×1卷积,其对条带池化输出的特征进行优化;Expand(·)表示扩展操作,使输出的条带特征在各自的方向上进行扩展,使其与输入的通道特征x大小一致;最后对扩展的特征进行相加进行融合;
步骤3.1.2,采用步长为2的3×3的卷积对特征图进行特征优化,其目的是增大卷积感受野,降低特征图尺寸,输出特征图
步骤3.1.3,将步骤3.1.2输出的特征图输入到第二个局部注意力模块,第二个局部注意力模块特征提取方式与步骤3.1.1相同;然后经过步骤3.1.2进行降采样,通过k个串联的局部注意力模块和步长为2的3×3的卷积依次输出和
步骤3.2,使用全局注意力模块进行全局上下文信息提取,获得高层语义特征;
所述步骤3.2的实现方式如下,
全局注意力模块用于对逐层提取的局部注意力特征进行全局上下文信息提取,其输入为最后一个局部注意力模块输出的特征图其经过全局注意力模块输出的特征值Fglobal的步骤包括3部分:
步骤3.2.1,全局上下文信息建模;对于输入的特征图首先采用1个1×1卷积进行特征降维成Rm×n×1,然后将其特征重塑尺寸为Rmn×1×1,随后输入到Softmax分类器中,输出每个像素的上下文信息表征向量Fmodel∈R(mn)×1,随后与重塑特征图逐像素相乘,输出上下文信息建模特征FCM∈Rd×1,具体公式如下所示:
其中,x表示特征图上的像素,m,n分别表示特征图的长和宽,i,j表示特征图中像素的序号,Wk表示1×1的卷积;
步骤3.2.2捕获通道间上下文依赖;采用1×1卷积捕捉通道间的上下文依赖关系,具体公式如下:
Fchannel=Wv2σ(LN((Wv1FCM)))
上式中Wv1和Wv2均表示1×1卷积,LN表示层归一化,σ表示激活函数;
步骤3.2.3上下文信息融合;采用残差连接的方式,将提取的通道上下文信息表征Fchannel与输入特征图相加,其中对于的第i个通道其每个像素均加上Fchannel第i个通道的值Fchannel(i),最终输出全局上下文信息特征值Fglobal;
步骤3.3,使用通道注意力模块自适应融合底层细节特征和高层语义特征;
所述步骤3.3的实现方式如下,
步骤3.3.1,将特征图采用双线性插值2倍上采样输出然后将2倍双线性插值的Fglobal串联作为输入特征,输入到自适应上下文特征聚合模块,具体公式如下:
上式子中,表示对Fglobal进行2倍双线性插值上采样;
步骤3.3.2,对输入数据进行通道上下文自适应聚合,具体公式如下:
上式中,avgpool(·)表示空间维度平均池化,W1,W2均表示1×1卷积,σ1表示ReLU激活函数,σ2表示sigmoid激活函数,其输出不同通道的上下文聚合权重,最后将通道权重与串联特征Fconnect相乘输出最终的自适应上下文聚合特征;
步骤3.3.3,将步骤3.3.2输出的特征图进行双线性插值上采样,然后与4倍线性插值的Fglobal串联输入到下一个自适应上下文聚合模块中,通过k个串联的自适应聚合模块,依次输出
步骤3.4,将通道注意力模块最终输出的特征图输入到交叉熵损失函数中,输出loss值;
步骤3.5,反向传播loss值更新网络模型参数;
步骤4,将待分类的高光谱影像输入到训练好的网络模型中,输出预测分类结果,实现地物类别的精细识别。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉大学,未经武汉大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110017089.2/1.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置