[发明专利]一种柚子病虫害的快速识别方法有效
申请号: | 202110838759.7 | 申请日: | 2021-07-23 |
公开(公告)号: | CN113538390B | 公开(公告)日: | 2023-05-09 |
发明(设计)人: | 师泽晨;石玉强;杨灵;白卫东;邹娟;陈宁夏;何杰锋 | 申请(专利权)人: | 仲恺农业工程学院 |
主分类号: | G06T7/00 | 分类号: | G06T7/00;G06V20/10;G06V10/44;G06V10/764;G06V10/82;G06N3/0464;G06N3/047;G06N3/048;G06N3/08 |
代理公司: | 广州科捷知识产权代理事务所(普通合伙) 44560 | 代理人: | 钟慧增 |
地址: | 510000 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 柚子 病虫害 快速 识别 方法 | ||
1.一种柚子病虫害的快速识别方法,其特征在于,包括如下步骤:
S1、收集柚子病虫害的图片,采用LabelImg对各图片中的病虫害根据其类别进行标注,构成数据集,将数据集按照一定的比例随机分为训练集和验证集;
S2、将训练集和验证集中的图片输入YOLOv5x网络模型进行模型训练,得到YOLOv5x网络模型的最佳权重数据;
S3、将最佳权重数据加载到YOLOv5x网络模型中,输入待识别图片,输出识别的病虫害类别;
所述YOLOv5网络模型包括依次连接的输入端、Backbone骨干网络、Neck网络和Head输出端,所述S2步骤中将训练集和验证集中的图片输入YOLOv5网络模型进行模型训练的方法为:
S2-1、图片预处理:图片进入输入端,输入端对图片进行预处理,预处理包括Mosaic数据增强、自适应锚框计算和自适应图片缩放;
S2-2、特征提取:预处理后的图片进入Backbone骨干网络,进行特征提取后得到三个不同大小的特征图;
S2-3、特征融合:将S2-2步骤得到的三个不同大小的特征图输入Neck网络进行特征融合,得到三个尺度的特征图;
S2-4、预测输出:将S2-3步骤得到的三个尺度的特征图输入Head输出端,得到三个特征张量,由此得到预测框的位置、类别和置信度;在训练阶段,将预测框与真实框进行匹配得出正负样本,然后通过计算损失函数来调节权重参数,验证阶段采用加权非极大值抑制的方式筛选预测框,通过计算准确率、平均精度来不断优化模型参数;
所述S2-4中在训练阶段,将预测框与真实框进行匹配得出正负样本,包括:
采用跨网格匹配,即从真实框所在网格的上下左右的四个网格中找到离真实框中心点最近的两个网格,再加上真实框所在网格共三个网格进行匹配,计算真实框和这三个网格的所有锚框的宽高比,当真实框的宽与锚框的宽的比值、真实框的高与锚框的高的比值均大于1/4且小于4,则认为匹配,即同时满足下列公式:
hyp=4
其中,GT_W是真实框的宽,GT_H是真实框的高,Anchor_W是锚框的宽,Anchor_H是锚框的高;
否则认为不匹配;
匹配的锚框通过预测框的回归公式得出匹配的预测框的位置信息,预测框的回归公式如下:
bx=2σ(tx)-0.5+cx
by=2σ(ty)-0.5+cy
bw=pw(2σ(tw))2
bh=ph(2σ(th))2
其中,bx、by分别为预测框的中心点坐标,bw、bh分别为预测框的宽度和高度,σ是sigmoid函数,预测框的置信度为σ(po),预测框的类别为(σ(pc1),σ(pc2)),po为置信度信息,(pc1,pc2)为类别信息;tx、ty是预测框目标中心点相对于该点所在网格左上角的偏移量,tw、th分别是预测框相对于锚框在宽度和高度上的缩放尺度,某一网格距离图片左上角的边距为(cx,cy),该网格对应的锚框的宽和高分别为(pw,ph);
匹配的预测框作为正样本,计算与真实框的定位损失、置信度损失和分类损失,正样本匹配的真实框的置信度为真实框和正样本的交并比;不匹配的预测框则作为负样本,只计算与真实框的置信度损失,而负样本匹配的真实框的置信度为0;
所述损失函数包括分类损失函数loss(class)、定位损失函数loss(box)和置信度损失函数loss(obj),损失函数Loss的定义如下:
Loss=loss(box)+loss(obj)+loss(class)
loss(GIOU)=1-GIOU
式中的参数有以下定义:网格为S×S,每个网格产生B个锚框,A为真实框矩形面积,B为预测框矩形面积,C为真实框与预测框形成的最小外接矩形面积,即同时包含了预测框和真实框的最小框的面积;IOU指交并比,预测框和真实框的交集和并集的比值;表示第i个网格的第j个预测框匹配上了这个目标,如果匹配,否则为0;表示第i个网格的第j个预测框不匹配该目标;是第i个网格边界框的真实置信度,c是第i个网格边界框预测的置信度;是真实的条件类别概率,Pi(c)是网络预测的条件类别概率;loss(BCE)是指二元交叉熵损失;λbox是指定位损失的权重系数,λclass是指分类损失的权重系数;而置信度损失由两部分组成,正样本置信度损失和负样本置信度损失,λobj是指正样本置信度损失的权重系数,λnoobj是指负样本置信度损失的权重系数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于仲恺农业工程学院,未经仲恺农业工程学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110838759.7/1.html,转载请声明来源钻瓜专利网。