[发明专利]一种基于轻量化改进YOLO的番茄成熟度检测方法在审
申请号: | 202210526772.3 | 申请日: | 2022-05-16 |
公开(公告)号: | CN114943697A | 公开(公告)日: | 2022-08-26 |
发明(设计)人: | 魏萱;曾泰恒 | 申请(专利权)人: | 福建农林大学 |
主分类号: | G06T7/00 | 分类号: | G06T7/00;G06T7/90;G06T7/73;G06V10/762;G06V10/774;G06V10/82;G06N3/04;G06N3/08 |
代理公司: | 福州元创专利商标代理有限公司 35100 | 代理人: | 陈明鑫;蔡学俊 |
地址: | 350002 福*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 量化 改进 yolo 番茄 成熟度 检测 方法 | ||
1.一种基于轻量化改进YOLO的番茄成熟度检测方法,其特征在于,包括如下步骤:
S1、采集大棚环境下的番茄图像形成番茄数据集,利用开源软件LabelImg对不同成熟度下的番茄图像进行锚框标注及类别划分,具体类别包括三类:Mature、Semi-Mature、UnMature;
S2、将番茄数据集划分为训练集、验证集和测试集,分别用于模型的训练和测试;
S3、利用k-means聚类算法对番茄数据集的真实边界框进行聚类分析,得到9种不同尺寸的先验框;
S4、采用YOLOv5作为基础模型,删除其Focus层,同时利用MobileNet V3的bncek模块替换YOLOv5的backbone部分,得到轻量化改进后的YOLOv5模型;
S5、利用标注好的训练集对改进后的YOLOv5模型进行训练,将经过backbone和haed层聚合后的特征输入YOLOv5 detect层,对番茄果实目标的位置和类别进行预测,利用损失函数训练模型,收敛以后得到最终的模型权重;
S6、利用训练得到的最优模型权重,将测试集输入进行检测,产生最终的检测结果。
2.根据权利要求1所述的一种基于轻量化改进YOLO的番茄成熟度检测方法,其特征在于,步骤S1中,采用以下方法构建番茄数据集:
分别在早上及下午两个时间段,在大棚环境下,利用智能手机采集番茄图像1000张,利用开源软件LabelImg对番茄数据集进行标注,其中番茄表皮颜色为深红色,满足采摘条件的,标注为“Mature”,表皮颜色为较浅的橘红色,尚不满足采摘条件的,标注为“Semi-Mature”,表皮颜色为绿色,还处于生长阶段的,标注为“UnMature”。
3.根据权利要求1所述的一种基于轻量化改进YOLO的番茄成熟度检测方法,其特征在于,步骤S3中,原始YOLOv5的三组Anchor是基于COCO数据集聚类得到,并不适用于番茄数据集,因此采用k-means聚类算法对于番茄数据集图片中的番茄果实目标检测框进行聚类分析,得到新的适用于大棚场景下番茄果实的Anchor数量与尺寸,并依据k-means聚类算法得到的参数修改YOLO v5网络配置文件中Anchor数量与尺寸。
4.根据权利要求1所述的一种基于轻量化改进YOLO的番茄成熟度检测方法,其特征在于,步骤S4中,改进后的YOLOv5模型,采用一个3x3的卷积层,接一层BatchNorm正则化层,加上hard_swish激活函数来代替原有的Focus层实现下采样功能,最终将输入尺寸为640×640×3的图像转化为320×320×16的特征图,其中,hard_swish激活函数表达式如下:
ReLU6=min(6,max(0,x))
其中,ReLU6为非线性激活函数,若x≤0,则直接转化为0,若x>0,则转化为x与6中的较大值;h-swish为非线性激活函数,若x≤-3,则转化为0,若x大于等于3,则转化为x,否则转化为x*(x+3)/6。
5.根据权利要求1所述的一种基于轻量化改进YOLO的番茄成熟度检测方法,其特征在于,步骤S4中,bncek结构包括通道可分离卷积+SE通道注意力机制+残差连接,其处理流程为:先将输入特征经过一个卷积组合层和一个深度可分离卷积组合层,然后将得到的特征图经过一个轻量化注意力结构,接着将SE注意力结构的输出通过concat操作对深度可分离卷积输出的特征进行通道加权,最终将输入特征通过add跳跃连接与加权后的特征相加,再经过一个卷积组合层处理后输出;其中,卷积组合层包括1×1的卷积层、批归一化层BN层和激活函数;深度可分离卷积组合层包括3×3的深度可分离卷积层、BatchNorm正则层和激活函数;SE注意力结构包括一个平均池化层和两个1×1的卷积层;其中,根据卷积核大小及步长的不同、SE注意力机制使用与否、激活函数的不同,调整不同层bneck结构的具体参数并进行组合,得到最终改进后的整体网络结构;将320×320×16的特征图输入到benck结构后,分别在第4、9、17层网络后输出三个不同尺度的特征图进入到Neck和detect层。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于福建农林大学,未经福建农林大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210526772.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种磷化镍纳米电催化剂及其制备方法
- 下一篇:一种汽车维修用多功能滑板