[发明专利]一种基于注意力机制的无人机高光谱农作物快速分类方法有效

专利信息
申请号: 202011507891.1 申请日: 2020-12-18
公开(公告)号: CN112668421B 公开(公告)日: 2022-04-29
发明(设计)人: 胡鑫;钟燕飞;王心宇 申请(专利权)人: 武汉大学
主分类号: G06V20/17 分类号: G06V20/17;G06V10/77;G06V10/80;G06V10/764;G06V10/82;G06K9/62;G06N3/04;G06N3/08
代理公司: 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 代理人: 王琪
地址: 430072 湖*** 国省代码: 湖北;42
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 注意力 机制 无人机 光谱 农作物 快速 分类 方法
【权利要求书】:

1.一种基于注意力机制的无人机高光谱农作物快速分类方法,其特征在于,包括如下步骤:

步骤1,对输入影像进行镜像填充;

步骤2,对镜像填充影像进行通道降维;

步骤3,构建用于农作物分类的网络模型,包括以下子步骤;

步骤3.1,使用光谱注意力模块提取通道间的上下文信息,获得低层细节特征;

所述步骤3.1的实现方式如下,

步骤3.1.1,设置步骤2中通道降维后得到特征图F,将特征图F输入第一个光谱注意力模块中,提取通道维上下文信息特征,光谱注意力模输出特征图Fspectral1,公式如下:

Fspectral1=Conv3×3stride=2(σ(MLP(AvgPool(F))+MLP(MaxPool(F))×F))

上式中,F表示输入的特征图,Fspectral为光谱注意力模块输出的特征图;σ(·)表示sigmoid激活函数,输出每个通道的重要性的权重;MLP(·)是一个2层的神经网络,并且上式中2个MLP共享权重;AvgPool(·)与MaxPool(·)分别表示在空间维进行平均池化和最大池化操作,其输出是一维向量;Conv3×3stride=2是一个步长为2的3×3的卷积,其目的是增大卷积感受野,便于提取高层语义特征提取;

步骤3.1.2,将步骤3.1.1输出的特征图Fspectral1输入到第二个光谱注意力模块中,第二个光谱注意力模块特征提取方式与步骤3.1.1相同;通过k个串联的光谱注意力模块依次输出Fspectral1,Fspectral2,…,Fspectralk

步骤3.2,使用尺度注意力模块提取多尺度上下文信息,获得高级语义特征;

步骤3.2的实现方式如下,

尺度注意力模块用于实现自适应的选择多尺度的上下文信息,其输入为最后一个光谱注意力模块输出的特征图Fspectralk,其具体包括5部分;

步骤3.2.1,使用四个不同空洞率r1,r2,r3,r4的3×3卷积算子对输入特征图Fspectralk进行特征不同尺度的上下文信息感知,分别输出四个不同尺度上下文特征图Fscaler1,其中,r1,r2,r3,r4根据地物真实分布确定不同的值;

步骤3.2.2,将3.2.1输出的不同尺度的上下文特征图进行逐像素加和,输出多尺度特征图Fscalesum,公式如下:

步骤3.2.3,将3.2.2输出的聚合特征Fscalesum进行空间全局池化来感知全局信息,生成通道维的统计信息,随后连接一个全连接层自适应的选择上下文特征,公式如下:

Fcs=FC(AvgPool(Fscalesum))

上式中,AvgPool(·)为全局池化,FC表示全连接层,采用ReLU激活函数;

步骤3.2.4,通过Softmax应用在步骤3.2.3输出的Fcs通道维上计算不同尺度上下文信息的权重,具体

其中ar1,ar2,ar3,ar4∈RC×1分别是多尺度上下文特征Fscaler1,的权重,Ar1,Ar2,Ar3,Ar4∈RC×d是维度转换矩阵,其中C是Fscalesum通道维度,d是Fcs的通道维度;由上式可以得出,对于任意一个通道i的权重,具有如下关系:

ar1[i]+ar2[i]+ar3[i]+ar4[i]=1

步骤3.2.5,将3.2.4计算的不同尺度的特征权重ar1,ar2,ar3,ar4分别对特征图Fscaler1,进行加权,然后对加权后的特征进行相加聚合,进而实现多尺度信息的自适应选择,公式表示如下:

Fscale[i]=ar1[i]·Fscaler1+ar2[i]·Fscaler2+ar3[i]·Fscaler3+ar4[i]·Fscaler4

步骤3.3,使用空间注意力模块中融合低层细节特征和高级语义特征;

步骤3.3的实现方式如下,

步骤3.3.1,将低层细节特征Fspectralk与高级语义特征Fscale级联后输入到空间注意力模块中,实现对不同类别的地物具有不同的注意力权重,进一步在保持细节的同时增加类别之间的区分性,空间注意力模块公式如下:

Fconnect=[Fspectralk,Fscale]

上式中,表示卷积核为3×3、扩张率为3的空洞卷积;AvgPoolchannel(Fconnect)和MaxPoolchannel(Fconnect)表示在通道维进行平均池化和最大池化,其输出的特征图是1个通道的特征图;[·]表示在通道维连接2个特征图的操作;σ(·)表示sigmoid激活函数,输出空间像素的每个权重;

步骤3.3.2,对于输出的空间注意力融合特征Fspatialk,通过一个3×3的卷积进行特征细化,然后使用2倍双线性插值进行上采样,公式如下:

Fspatial_upk=Finterpolate(Conv3×3(Fspatialk))

上式中Finterpolate表示2倍上采样的双线性插值;

步骤3.3.3,对Fspatial_upk和Fspectralk-1经过步骤3.3.1和3.3.2生成Fspatial_upk-1,依次经过k个空间注意力模块,最终对Fspatial_up2和Fspectral1经过步骤3.3.1和3.3.2,生成最终的特征图

步骤3.4,将空间注意力模块最终输出的特征图输入边界约束的损失函数中,输出loss值;

步骤3.5,反向传播loss值更新网络模型参数;

步骤4,将待分类的双高影像输入到网络模型,输出预测分类结果,实现农作物的精细分类识别。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉大学,未经武汉大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202011507891.1/1.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top