[发明专利]一种基于注意力机制的无人机高光谱农作物快速分类方法有效
申请号: | 202011507891.1 | 申请日: | 2020-12-18 |
公开(公告)号: | CN112668421B | 公开(公告)日: | 2022-04-29 |
发明(设计)人: | 胡鑫;钟燕飞;王心宇 | 申请(专利权)人: | 武汉大学 |
主分类号: | G06V20/17 | 分类号: | G06V20/17;G06V10/77;G06V10/80;G06V10/764;G06V10/82;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 | 代理人: | 王琪 |
地址: | 430072 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 注意力 机制 无人机 光谱 农作物 快速 分类 方法 | ||
1.一种基于注意力机制的无人机高光谱农作物快速分类方法,其特征在于,包括如下步骤:
步骤1,对输入影像进行镜像填充;
步骤2,对镜像填充影像进行通道降维;
步骤3,构建用于农作物分类的网络模型,包括以下子步骤;
步骤3.1,使用光谱注意力模块提取通道间的上下文信息,获得低层细节特征;
所述步骤3.1的实现方式如下,
步骤3.1.1,设置步骤2中通道降维后得到特征图F,将特征图F输入第一个光谱注意力模块中,提取通道维上下文信息特征,光谱注意力模输出特征图Fspectral1,公式如下:
Fspectral1=Conv3×3stride=2(σ(MLP(AvgPool(F))+MLP(MaxPool(F))×F))
上式中,F表示输入的特征图,Fspectral为光谱注意力模块输出的特征图;σ(·)表示sigmoid激活函数,输出每个通道的重要性的权重;MLP(·)是一个2层的神经网络,并且上式中2个MLP共享权重;AvgPool(·)与MaxPool(·)分别表示在空间维进行平均池化和最大池化操作,其输出是一维向量;Conv3×3stride=2是一个步长为2的3×3的卷积,其目的是增大卷积感受野,便于提取高层语义特征提取;
步骤3.1.2,将步骤3.1.1输出的特征图Fspectral1输入到第二个光谱注意力模块中,第二个光谱注意力模块特征提取方式与步骤3.1.1相同;通过k个串联的光谱注意力模块依次输出Fspectral1,Fspectral2,…,Fspectralk;
步骤3.2,使用尺度注意力模块提取多尺度上下文信息,获得高级语义特征;
步骤3.2的实现方式如下,
尺度注意力模块用于实现自适应的选择多尺度的上下文信息,其输入为最后一个光谱注意力模块输出的特征图Fspectralk,其具体包括5部分;
步骤3.2.1,使用四个不同空洞率r1,r2,r3,r4的3×3卷积算子对输入特征图Fspectralk进行特征不同尺度的上下文信息感知,分别输出四个不同尺度上下文特征图Fscaler1,其中,r1,r2,r3,r4根据地物真实分布确定不同的值;
步骤3.2.2,将3.2.1输出的不同尺度的上下文特征图进行逐像素加和,输出多尺度特征图Fscalesum,公式如下:
步骤3.2.3,将3.2.2输出的聚合特征Fscalesum进行空间全局池化来感知全局信息,生成通道维的统计信息,随后连接一个全连接层自适应的选择上下文特征,公式如下:
Fcs=FC(AvgPool(Fscalesum))
上式中,AvgPool(·)为全局池化,FC表示全连接层,采用ReLU激活函数;
步骤3.2.4,通过Softmax应用在步骤3.2.3输出的Fcs通道维上计算不同尺度上下文信息的权重,具体
其中ar1,ar2,ar3,ar4∈RC×1分别是多尺度上下文特征Fscaler1,的权重,Ar1,Ar2,Ar3,Ar4∈RC×d是维度转换矩阵,其中C是Fscalesum通道维度,d是Fcs的通道维度;由上式可以得出,对于任意一个通道i的权重,具有如下关系:
ar1[i]+ar2[i]+ar3[i]+ar4[i]=1
步骤3.2.5,将3.2.4计算的不同尺度的特征权重ar1,ar2,ar3,ar4分别对特征图Fscaler1,进行加权,然后对加权后的特征进行相加聚合,进而实现多尺度信息的自适应选择,公式表示如下:
Fscale[i]=ar1[i]·Fscaler1+ar2[i]·Fscaler2+ar3[i]·Fscaler3+ar4[i]·Fscaler4;
步骤3.3,使用空间注意力模块中融合低层细节特征和高级语义特征;
步骤3.3的实现方式如下,
步骤3.3.1,将低层细节特征Fspectralk与高级语义特征Fscale级联后输入到空间注意力模块中,实现对不同类别的地物具有不同的注意力权重,进一步在保持细节的同时增加类别之间的区分性,空间注意力模块公式如下:
Fconnect=[Fspectralk,Fscale]
上式中,表示卷积核为3×3、扩张率为3的空洞卷积;AvgPoolchannel(Fconnect)和MaxPoolchannel(Fconnect)表示在通道维进行平均池化和最大池化,其输出的特征图是1个通道的特征图;[·]表示在通道维连接2个特征图的操作;σ(·)表示sigmoid激活函数,输出空间像素的每个权重;
步骤3.3.2,对于输出的空间注意力融合特征Fspatialk,通过一个3×3的卷积进行特征细化,然后使用2倍双线性插值进行上采样,公式如下:
Fspatial_upk=Finterpolate(Conv3×3(Fspatialk))
上式中Finterpolate表示2倍上采样的双线性插值;
步骤3.3.3,对Fspatial_upk和Fspectralk-1经过步骤3.3.1和3.3.2生成Fspatial_upk-1,依次经过k个空间注意力模块,最终对Fspatial_up2和Fspectral1经过步骤3.3.1和3.3.2,生成最终的特征图
步骤3.4,将空间注意力模块最终输出的特征图输入边界约束的损失函数中,输出loss值;
步骤3.5,反向传播loss值更新网络模型参数;
步骤4,将待分类的双高影像输入到网络模型,输出预测分类结果,实现农作物的精细分类识别。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉大学,未经武汉大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011507891.1/1.html,转载请声明来源钻瓜专利网。