[发明专利]基于注意力机制和改进特征融合的小目标害虫检测方法在审
申请号: | 202211522257.4 | 申请日: | 2022-11-30 |
公开(公告)号: | CN115810123A | 公开(公告)日: | 2023-03-17 |
发明(设计)人: | 戴凡杰;万里 | 申请(专利权)人: | 重庆大学 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/40;G06V10/77;G06V10/80;G06V10/82;G06N3/045;G06N3/08 |
代理公司: | 重庆天成卓越专利代理事务所(普通合伙) 50240 | 代理人: | 王宏松 |
地址: | 404100 *** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 注意力 机制 改进 特征 融合 目标 害虫 检测 方法 | ||
本发明提出了一种基于注意力机制和改进特征融合的小目标害虫检测方法,包括以下步骤:S1,获取害虫图像数据集并进行预处理,所述预处理包括镜像翻转和/或随机旋转;S2,将采集的小目标害虫图像数据输入检测模型进行模型训练;S3,将待测的小目标害虫图像输入训练完毕的检测模型得到检测结果。本发明基于深度学习的图像识别技术通过大量的模型参数自主学习,能够获得图像的全局特征和细节特征,对不同环境下的小目标害虫都有较好的鲁棒性和泛化能力。
技术领域
本发明涉及虫害图像识别技术领域,特别是涉及一种基于注意力机制和改进特征融合的小目标害虫检测方法。
背景技术
目前,基于模式识别的害虫检测方法虽然已经比较成熟,但在针对小目标害虫的检测方面仍然存在着一些问题:
(1)小目标害虫图像主要来源于实验室环境下的拍摄,因此图像不具备野生自然环境下的复杂特征,这使得训练出来的检测模型不具备泛化能力。
(2)小目标的定义是面积小于32*32的物体,由此导致目标携带的信息少,特征表达能力弱,在基于深层卷积神经网络的机器学习算法上,目标特征在深层次的信息缺失,不能提取到有效的特征,从而导致检测精度下降。
(3)目前较为流行的网络模型大多非常复杂,计算量比较大,对计算能力的要求比较高,训练时间较长。
发明内容
本发明旨在至少解决现有技术中存在的技术问题,特别创新地提出了基于注意力机制和改进特征融合的小目标害虫检测方法。
为了实现本发明的上述目的,本发明提供了一种基于注意力机制和改进特征融合的小目标害虫检测方法,包括以下步骤:
S1,获取害虫图像数据集并进行预处理,所述预处理包括镜像翻转和/或随机旋转;
S2,将采集的小目标害虫图像数据输入检测模型进行模型训练;
S3,将待测的小目标害虫图像输入训练完毕的检测模型得到检测结果。
进一步地,所述的检测模型包括:
VGG16网络,作为主干网络用于特征提取;
在所述VGG16提取特征之后为注意力机制,使得特征覆盖到待识别物体的更多部位,能让网络学会关注到小目标信息,最终判别物体的几率也更高。
在所述注意力机制后为特征融合,用于保留网络中的浅层信息,通过特征融合,将低分辨率但语义强的特征和高分辨率但语义弱的特征结合起来。
将注意力机制和改进的特征融合机制相结合,从空间和通道这两个维度关注小目标特征信息,并同时融合细节特征和全局特征,提升模型对于小目标害虫的检测精度。
进一步地,所述注意力机制采用CBAM,包括通道注意力模块和空间注意力模块,包括如下步骤:
将VGG16提取的特征图T_S输入通道注意力模块,通道注意力模块对特征图分别进行最大池化和平均池化,然后分别经过全连接层先降低维度再升高维度,最后将处理之后的特征图相加;
将相加后的特征图与VGG16提取的特征图T_S进行相乘,作为空间注意力模块的输入X_S,空间注意力模块首先在通道维度上进行平均池化和最大池化,然后将他们产生的特征图进行拼接,然后进行卷积操作,再通过sigmoid激活函数,将通过激活函数的特征图与特征图X_S进行相乘操作,得到特征图K_C,将特征图K_C与VGG16提取的特征图T_S相加,得到经过注意力机制的特征图。
CBAM具有轻量化,不复杂,计算量小的特点,此外,相较于传统的基于神经网络的注意力机制关注通道维度,CBAM从通道和空间两个维度考虑,能保留更多有效特征。通道注意力模块用于聚焦特征图中有什么有用的信息,空间注意力模块用于聚焦特征图中信息的位置。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆大学,未经重庆大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211522257.4/2.html,转载请声明来源钻瓜专利网。