[发明专利]基于多尺度和非压缩激励通道注意力的野外蝴蝶识别方法在审
申请号: | 202111357705.5 | 申请日: | 2021-11-16 |
公开(公告)号: | CN114049535A | 公开(公告)日: | 2022-02-15 |
发明(设计)人: | 周文进;李凡 | 申请(专利权)人: | 昆明理工大学 |
主分类号: | G06V10/774 | 分类号: | G06V10/774;G06V10/44;G06V10/771;G06K9/62;G06F16/951 |
代理公司: | 昆明明润知识产权代理事务所(普通合伙) 53215 | 代理人: | 马海红 |
地址: | 650093 云*** | 国省代码: | 云南;53 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 尺度 压缩 激励 通道 注意力 野外 蝴蝶 识别 方法 | ||
1.一种基于多尺度和非压缩激励通道注意力的野外蝴蝶识别方法,其特征在于:包括如下步骤:
1)构建包含200种蝴蝶的混合数据集;
2)确定通道注意力潮流算法;
3)改进原始压缩激励通道注意力网络;
4)将改进的通道注意力网络嵌入到YOLOv3主干模型中;
5)训练模型,识别图像中的蝴蝶。
2.根据权利要求1所述的一种基于多尺度和非压缩激励通道注意力的野外蝴蝶识别方法,其特征在于:所述步骤1)包括如下步骤:
step1.1:使用网络爬虫技术从美国标本蝴蝶网站爬取野外蝴蝶与标本蝴蝶图像,爬取蝴蝶的分类层级为:“科、亚科、族、属、种”,包含4科、96属、共200种蝴蝶,每种蝴蝶均包含野外拍摄的图像和标本图像,共计5374张图像;
step1.2,使用Labelimg标注工具对数据集图像进行位置标注,种类标注采用二名法,标注野外图像蝴蝶位置时使标注区域包含触角;标注标本图像蝴蝶位置时,只标注蝴蝶的主体位置。
3.根据权利要求1所述的基于多尺度和非压缩激励通道注意力的野外蝴蝶识别方法,其特征在于:所述步骤2)中通道注意力潮流算法,即压缩激励网络如下:
首先,根据压缩激励网络原始模型可以有效地利用图像全局信息,对高维特征的每个独立通道采取了全局平均池化;
其次,通过两个非线性全连接层的结合来实现非线性通道间相互作用的获取;
最后,经过一个Sigmoid函数生成了通道权重XSE:
其中高维特征D为输入图片的尺寸,R为矩阵空间,表示全局平均池化,W为输入特征图中到第0行到第i行的行数,H为输入特征图中到第0列到第j行的列数,Xij表示有i行j列的特征图,FC1RELUFC2中FC1与FC2表示两个全连接层,两个全连接层之间加了RELU函数防止梯度消失,σ为Sigmoid函数。
4.根据权利要求3所述的基于多尺度和非压缩激励通道注意力的野外蝴蝶识别方法,其特征在于:所述步骤3)包括如下步骤:
Step3.1:分别使用两种卷积核的卷积提取特征得到两个卷积块,然后把多种感受野特征拼接在一起作为通道注意力网络的输入,得到多尺度通道特征权重XMutiSE,如公式(2)所示:
其中n表示第i个的卷积核,其中m表示第j个的特征图,XSE表示步骤2中的压缩激励网络,f2D表示二维卷积;
Step3.2:使用自适应卷积核的1D卷积代替全连接层,公式(1)中XSE调整为:
式中:XSE1D为1D卷积代替全连接层后的注意力网络,f1D表示一维卷积;k为自适应卷积核;C为特征图的通道数。
5.根据权利要求1所述的基于多尺度和非压缩激励通道注意力的野外蝴蝶识别方法,其特征在于:所述步骤4)中将改进的通道注意力网络嵌入到YOLOv3主干网络位置如下:
将构建好的注意力网络MutiSE1D嵌入到主干网络Tiny-darknet的第7个卷积后面。
6.根据权利要求1所述的基于多尺度和非压缩激励通道注意力的野外蝴蝶识别方法,其特征在于:所述步骤5)中训练模型与识别蝴蝶方法如下:
训练内嵌通道注意力MutiSE1D的识别网络,训练时Loss采用部分损失和的形式:
Loss=lbox+lobj+lcls (5)
其中lbox表示预测框中心点、宽、高的误差,也就是预测框的误差,lobj是置信度带来的误差,lcls是预测类别的误差,最后模型推理时一次性回归出蝴蝶在图像中的坐标、宽高、类别,即识别出图像中的蝴蝶。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于昆明理工大学,未经昆明理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111357705.5/1.html,转载请声明来源钻瓜专利网。