[发明专利]一种基于改进YOLOv5的串型番茄实时检测方法在审
申请号: | 202111262874.0 | 申请日: | 2021-10-28 |
公开(公告)号: | CN114022878A | 公开(公告)日: | 2022-02-08 |
发明(设计)人: | 宋国柱;景超;王堃;武海文;银宇栋 | 申请(专利权)人: | 山西农业大学 |
主分类号: | G06V20/68 | 分类号: | G06V20/68;G06V10/44;G06V10/764;G06V10/82;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 太原申立德知识产权代理事务所(特殊普通合伙) 14115 | 代理人: | 郭海燕 |
地址: | 030801 山*** | 国省代码: | 山西;14 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 改进 yolov5 番茄 实时 检测 方法 | ||
1.一种基于改进YOLOv5的串型番茄实时检测方法,其特征在于,包括以下步骤:
步骤1,采集串型番茄图像,对串型番茄图像进行划分和标注,构建串型番茄检测数据集;
步骤2,对模型输入图像进行预处理,包括Mosaic数据增强,自适应锚框计算,自适应图片缩放处理;
步骤3,基于YOLOv5,引入注意力机制,构建串型番茄实时检测模型TomatoNet;
步骤4,对步骤3构建的串型番茄实时检测模型TomatoNet进行训练;
步骤5,对步骤4训练好的模型进行验证,使其准确率达到85%,视频每秒传输帧数达到30fps;
步骤6,采用验证后的模型TomatoNet进行串型番茄实时检测。
2.根据权利要求1所述的一种基于改进YOLOv5的串型番茄实时检测方法,其特征在于,所述步骤1中对串型番茄图像进行划分和标注的具体过程为:先将采集的串型番茄图像按照训练集:验证集=8:2进行划分,然后使用LabelImg工具对图像数据进行框选标注,按照串型番茄成熟度将串型番茄图像数据分为成熟、半成熟和不熟三类。
3.根据权利要求1所述的一种基于改进YOLOv5的串型番茄实时检测方法其特征在于:所述步骤2中Mosaic数据增强为随机选取四张图像,采用随机缩放、随机排布、随机裁剪的方式进行拼接。
4.根据权利要求1所述的一种基于改进YOLOv5的串型番茄实时检测方法其特征在于:所述步骤2中预处理还包括对图像角度、对比度即亮度、噪声比重进行不同程度的调整。
5.根据权利要求1所述的一种基于改进YOLOv5的串型番茄实时检测方法,其特征在于,所述步骤3中番茄实时检测模型TomatoNet包括:输入端、Backbone、通道注意力模块、Neck、Prediction;其中,Backbone包括Focus、BottleNeckCSP和spp;Neck包括自顶向下传递强特征的FPN结构以及自底向上的含有两个PAN结构的特征金字塔。
6.根据权利要求1所述的一种基于改进YOLOv5的串型番茄实时检测方法,其特征在于,所述步骤4中采用训练集数据对串型番茄实时检测模型TomatoNet进行训练,具体包括以下步骤:
4.1网络Backbone的Focus先将输入复制四份并通过切片操作分为四个切片;通过Concat层将其进行拼接;再经过卷积层,提取输入的不同特征;通过batch norm层,将每次的梯度分布都控制在原点附近,实现结果归一化;最后用leaky_relu激活函数输入结果到网络Backbone的下一层卷积BottleNeckCSP;
在BottleNeckCSP卷积将输入分成两部分,一部分先进行n次BottleNeck操作,再进行卷积操作,另一部分直接进行卷积操作,然后两部分再经过Concat拼接后输出至空间金字塔池化spp;
在空间金字塔池化spp中,先进行Conv提取特征输出,再经过三个不同kernel_size的最大池化层进行下采样,将各自输出结果进行拼接融合并与其初始特征相加,最后再经过卷积Conv将输出恢复到同初始输入一致;
4.2Backbone输出的特征向量进入通道注意力模块,首先需要处理输入特征向量a,其表示如下:
a={a1,a2,...,aL},ai∈RD
式中:L表示特征向量的总数目,D表示维度空间,R表示元素分量均属于实数域;
此外需要获取t时刻的每个特征向量ai的权重at,i,计算如下式所示:
lti=fatt(ai,ht-1)
式中:lti是中间变量,k是特征向量的序号,fatt(.)表示多层感知机,ht-1表示t-1时刻的状态;
得到权重之后,模型就具有筛选输入特征向量序列a的能力了,经过筛选后,得到序列为:
zt=φ({ai})
其中,当注意力机制为软注意力时,φ为线性加权函数,当注意力机制为硬注意力时,表示特征向量是离散的;
4.3施加注意力后的特征信息输入模型Neck层,将特征混合组合,并传递到Prediction;
4.4在Prediction预测层,模型采用GIoU作为损失函数,通过非极大值抑制NMS来筛选目标框;
4.5通过F1值和mAP2个指标对训练结果进行评估,最终选取最后一代保存的模型权重文件作为最终的训练结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山西农业大学,未经山西农业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111262874.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种实体自定义项处理方法、设备及介质
- 下一篇:触控显示面板和显示装置