[发明专利]一种基于改进YOLOv5的串型番茄实时检测方法在审

专利信息
申请号: 202111262874.0 申请日: 2021-10-28
公开(公告)号: CN114022878A 公开(公告)日: 2022-02-08
发明(设计)人: 宋国柱;景超;王堃;武海文;银宇栋 申请(专利权)人: 山西农业大学
主分类号: G06V20/68 分类号: G06V20/68;G06V10/44;G06V10/764;G06V10/82;G06K9/62;G06N3/04;G06N3/08
代理公司: 太原申立德知识产权代理事务所(特殊普通合伙) 14115 代理人: 郭海燕
地址: 030801 山*** 国省代码: 山西;14
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 改进 yolov5 番茄 实时 检测 方法
【权利要求书】:

1.一种基于改进YOLOv5的串型番茄实时检测方法,其特征在于,包括以下步骤:

步骤1,采集串型番茄图像,对串型番茄图像进行划分和标注,构建串型番茄检测数据集;

步骤2,对模型输入图像进行预处理,包括Mosaic数据增强,自适应锚框计算,自适应图片缩放处理;

步骤3,基于YOLOv5,引入注意力机制,构建串型番茄实时检测模型TomatoNet;

步骤4,对步骤3构建的串型番茄实时检测模型TomatoNet进行训练;

步骤5,对步骤4训练好的模型进行验证,使其准确率达到85%,视频每秒传输帧数达到30fps;

步骤6,采用验证后的模型TomatoNet进行串型番茄实时检测。

2.根据权利要求1所述的一种基于改进YOLOv5的串型番茄实时检测方法,其特征在于,所述步骤1中对串型番茄图像进行划分和标注的具体过程为:先将采集的串型番茄图像按照训练集:验证集=8:2进行划分,然后使用LabelImg工具对图像数据进行框选标注,按照串型番茄成熟度将串型番茄图像数据分为成熟、半成熟和不熟三类。

3.根据权利要求1所述的一种基于改进YOLOv5的串型番茄实时检测方法其特征在于:所述步骤2中Mosaic数据增强为随机选取四张图像,采用随机缩放、随机排布、随机裁剪的方式进行拼接。

4.根据权利要求1所述的一种基于改进YOLOv5的串型番茄实时检测方法其特征在于:所述步骤2中预处理还包括对图像角度、对比度即亮度、噪声比重进行不同程度的调整。

5.根据权利要求1所述的一种基于改进YOLOv5的串型番茄实时检测方法,其特征在于,所述步骤3中番茄实时检测模型TomatoNet包括:输入端、Backbone、通道注意力模块、Neck、Prediction;其中,Backbone包括Focus、BottleNeckCSP和spp;Neck包括自顶向下传递强特征的FPN结构以及自底向上的含有两个PAN结构的特征金字塔。

6.根据权利要求1所述的一种基于改进YOLOv5的串型番茄实时检测方法,其特征在于,所述步骤4中采用训练集数据对串型番茄实时检测模型TomatoNet进行训练,具体包括以下步骤:

4.1网络Backbone的Focus先将输入复制四份并通过切片操作分为四个切片;通过Concat层将其进行拼接;再经过卷积层,提取输入的不同特征;通过batch norm层,将每次的梯度分布都控制在原点附近,实现结果归一化;最后用leaky_relu激活函数输入结果到网络Backbone的下一层卷积BottleNeckCSP;

在BottleNeckCSP卷积将输入分成两部分,一部分先进行n次BottleNeck操作,再进行卷积操作,另一部分直接进行卷积操作,然后两部分再经过Concat拼接后输出至空间金字塔池化spp;

在空间金字塔池化spp中,先进行Conv提取特征输出,再经过三个不同kernel_size的最大池化层进行下采样,将各自输出结果进行拼接融合并与其初始特征相加,最后再经过卷积Conv将输出恢复到同初始输入一致;

4.2Backbone输出的特征向量进入通道注意力模块,首先需要处理输入特征向量a,其表示如下:

a={a1,a2,...,aL},ai∈RD

式中:L表示特征向量的总数目,D表示维度空间,R表示元素分量均属于实数域;

此外需要获取t时刻的每个特征向量ai的权重at,i,计算如下式所示:

lti=fatt(ai,ht-1)

式中:lti是中间变量,k是特征向量的序号,fatt(.)表示多层感知机,ht-1表示t-1时刻的状态;

得到权重之后,模型就具有筛选输入特征向量序列a的能力了,经过筛选后,得到序列为:

zt=φ({ai})

其中,当注意力机制为软注意力时,φ为线性加权函数,当注意力机制为硬注意力时,表示特征向量是离散的;

4.3施加注意力后的特征信息输入模型Neck层,将特征混合组合,并传递到Prediction;

4.4在Prediction预测层,模型采用GIoU作为损失函数,通过非极大值抑制NMS来筛选目标框;

4.5通过F1值和mAP2个指标对训练结果进行评估,最终选取最后一代保存的模型权重文件作为最终的训练结果。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山西农业大学,未经山西农业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202111262874.0/1.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top