[发明专利]一种基于通道注意力机制的虫害图像检测方法有效
申请号: | 202110796527.X | 申请日: | 2021-07-14 |
公开(公告)号: | CN113487576B | 公开(公告)日: | 2023-08-22 |
发明(设计)人: | 王儒敬;董士风;李瑞;张洁;焦林;刘康;滕越;刘海云;王晓栋 | 申请(专利权)人: | 中国科学院合肥物质科学研究院 |
主分类号: | G06T7/00 | 分类号: | G06T7/00;G06V10/44;G06V10/764;G06V10/82;G06N3/0464;G06N3/048;G06N3/08 |
代理公司: | 合肥国和专利代理事务所(普通合伙) 34131 | 代理人: | 张祥骞 |
地址: | 230031 安徽*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 通道 注意力 机制 虫害 图像 检测 方法 | ||
1.一种基于通道注意力机制的虫害图像检测方法,其特征在于,包括以下步骤:
11)采集虫害图像并建立虫害数据集:获取虫害图像进行预处理和标记,建立虫害数据集;
12)构建基于通道注意力机制的虫害图像检测模型:对虫害图像检测模型进行构建,其包括多尺度特征金字塔预测结构和用于特征层融合后的通道积空间注意力机制结构;
所述构建基于通道注意力机制的虫害图像检测模型包括以下步骤:
121)将多尺度特征金字塔预测结构作为虫害图像检测模型的第一层,构建多尺度特征金字塔预测结构:
1211)设定将虫害图像输入深度卷积神经网络,得到下采样尺寸为原图1/4、1/8、1/16、1/32倍的特征图,分别为Ci,i∈(2,3,4,5);
1212)将上述4个特征图Ci按照如下方式进行特征加权融合,得到多尺度特征金字塔预测结构:
C5通过卷积核和步长都为1的卷积后得到P5,经过下采样得到尺寸为原图1/64倍的特征图为P6;
P5进行双线性插值上采样以得到输出特征图分辨率为1/16倍的特征图C4,将P5与C4进行特征加权融合得到P4;
P4进行双线性插值上采样以得到输出特征图分辨率为1/8倍的特征图特征图C3,将P4与C3进行特征加权融合得到P3;
P3进行双线性插值上采样以得到输出特征图分辨率为1/4倍的特征图C2,将P3与C2进行特征加权融合得到P2;
获得的Pi,i∈(2,3,4,5,6)构成多尺度特征金字塔;
122)将通道积空间注意力机制结构作为虫害图像检测模型的第二层,针对多尺度特征金字塔Pi,i∈(2,3,4,5,6)构建特征层融合后的通道积空间注意力机制结构:
1221)对特征金字塔上每层特征图P2、P3、P4、P5、P6上进行全局自适应最大池化和全局自适应平均池化产生两个不同空间的上下文描述,以获得全局特征信息和平均特征信息,分别输出
特征图包含信息数学表达式如下:
其中,是由大小高度为H宽度为W以及通道数为C的特征图Fc(i,j)生成,i,j代表特征图上像素点的坐标;
1222)分别对两个特征图用基于通道压缩的注意力模块将通道数降至1/8倍,得到的结果分别记为
1223)对两个特征图使用ReLU非线性激活函数和基于通道放大的注意力模块将通道数放大8倍后,得到的结果分别记为
1224)将合并得到两种通道的特征,使用Sigmoid激活函数来自适应对特征图上信息进行建模;
1225)最后再将原特征图与自适应学习建模后的特征图进行哈达玛积,实现通道特征重校准的效果;
13)对虫害图像检测模型进行训练:利用虫害数据集通过随机梯度下降算法对虫害图像检测模型进行训练;
14)待检测虫害图像的获取:获取待检测的虫害图像,并进行预处理;
15)虫害图像检测结果的获得:将预处理后的待检测虫害图像输入训练后的虫害图像检测模型,虫害图像检测模型输出检测结果(c,x,y,w,h),即图像中每个虫害的类别和边框位置。
2.根据权利要求1所述的一种基于通道注意力机制的虫害图像检测方法,其特征在于,所述对虫害图像检测模型进行训练包括以下步骤:
21)将虫害数据集输入虫害图像检测模型;
22)设定在随机梯度下降优化算法中,动量设置为0.9,权重衰减设置为0.00004,神经元失活率设置为0.5,基础学习率设置为0.001,训练12个轮次epoch,
其中分类函数是交叉熵损失函数,数学表达式如下:
其中C表示类别数,yi表示若该类别与标注类别相同则取1,否则取0,pi表示预测样本属于i的概率;
边框回归函数是L1范数损失函数,表达式如下:
其中的G表示真实标注框,R表示回归框,其中的x,y,w,h定义如下:
x=(x*-xr)/wr
y=(y*-yr)/hr
w=log(w*/wr)
h=log(h*/hr)
x*和y*是标注框的中心点坐标,w*,h*标注框的宽和高,xr,yr,wr和hr是对应预测框的值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院合肥物质科学研究院,未经中国科学院合肥物质科学研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110796527.X/1.html,转载请声明来源钻瓜专利网。