[发明专利]一种鸽蛋品质识别方法有效
申请号: | 202110838756.3 | 申请日: | 2021-07-23 |
公开(公告)号: | CN113538389B | 公开(公告)日: | 2023-05-09 |
发明(设计)人: | 杨航;杨灵;邹娟;吴霆;师泽晨;苏立恒 | 申请(专利权)人: | 仲恺农业工程学院 |
主分类号: | G06T7/00 | 分类号: | G06T7/00;G06T7/62;G06T7/73;G06V10/44;G06V10/75;G06V10/764;G06V10/774;G06V10/82;G06N3/0464;G06N3/045;G06N3/048;G06N3/084 |
代理公司: | 广州科捷知识产权代理事务所(普通合伙) 44560 | 代理人: | 钟慧增 |
地址: | 510000 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 鸽蛋 品质 识别 方法 | ||
1.一种鸽蛋品质识别方法,其特征在于,包括如下步骤:
S1、拍摄并收集不同品质的鸽蛋的图片,采用LabelImg对图片中的鸽蛋进行标注,构建数据集,将数据集按照8:1的比例分为训练集和验证集;
S2、分别将训练集和验证集中的图片输入YOLOv5s网络模型进行模型训练,得到YOLOv5s网络模型的最佳权重数据;
S3、将最佳权重数据加载到YOLOv5s网络模型中,输入待识别的图片,输出识别的鸽蛋的品质;
所述YOLOv5s网络模型包括输入端、Focus模块、Neck模块、Head模块以及输出端,所述S2步骤中分别将训练集和验证集中的图片输入YOLOv5s网络模型进行模型训练的方法为:
S2-1、图片预处理:对图片进行预处理,整个过程包括Mosaic数据增强、自适应锚框计算和自适应图片缩放;
S2-2、特征提取:输入预处理后的图片数据到YOLOv5s的Focus模块,得到不同大小的特征图,然后输入到YOLOv5s的Neck模块;
S2-3、特征融合:YOLOv5s的Head模块将不同大小的特征图进行融合,最终得到三个尺度的特征图,并将特征图传递到输出端;
S2-4、输出:YOLOv5s的输出端对Detect结构输出的三个特征张量进行预测,生成预测框的位置、类别和置信度;
S2-5、模型优化:计算YOLOv5s的损失函数,使用反向传播算法进一步训练YOLOv5s网络,优化模型参数;
S2-6、测试图片:导出YOLOv5s模型的权重数据,将测试图片输入到权重数据,查看测试结果;
所述S2-4中在训练阶段,将预测框与真实框进行匹配得出正负样本,包括:
采用跨网格匹配,即从真实框所在网格的上下左右的四个网格中找到离真实框中心点最近的两个网格,再加上真实框所在网格共三个网格进行匹配,计算真实框和这三个网格的所有锚框的宽高比,当真实框的宽与锚框的宽的比值、真实框的高与锚框的高的比值均大于1/4且小于4,则认为匹配,即同时满足下列公式:
hyp=4
其中,GT_W是真实框的宽,GT_H是真实框的高,Anchor_W是锚框的宽,Anchor_H是锚框的高;
否则认为不匹配;
匹配的锚框通过预测框的回归公式得出匹配的预测框的位置信息,预测框的回归公式如下:
bx=2σ(tx)-0.5+cx
by=2σ(ty)-0.5+cy
bw=pw(2σ(tw))2
bh=ph(2σ(th))2
其中,bx、by分别为预测框的中心点坐标,bw、bh分别为预测框的宽度和高度,σ是sigmoid函数,预测框的置信度为σ(po),预测框的类别为(σ(pc1),σ(pc2));tx、ty是预测框目标中心点相对于该点所在网格左上角的偏移量,tw、th分别是预测框相对于锚框在宽度和高度上的缩放尺度,po为置信度信息,(pc1,pc2)为类别信息;某一网格距离图片左上角的边距为(cx,cy),该网格对应的锚框的宽和高分别为(pw,ph);
匹配的预测框作为正样本,计算与真实框的定位损失、置信度损失和分类损失,正样本匹配的真实框的置信度为真实框和正样本的交并比;不匹配的预测框则作为负样本,只计算与真实框的置信度损失,而负样本匹配的真实框的置信度为0;
所述Head模块中采用GIoU_Loss做Bounding box的损失函数;
所述损失函数包括分类损失函数loss(class)、定位损失函数loss(box)和置信度损失函数loss(obj),损失函数Loss的定义如下:
Loss=loss(box)+loss(obj)+loss(class)
loss(GIOU)=1-GIOU
式中的参数有以下定义:网格为S×S,每个网格产生B个锚框,A为真实框矩形面积,B为预测框矩形面积,C为真实框与预测框形成的最小外接矩形面积,即同时包含了预测框和真实框的最小框的面积;IOU指交并比,预测框和真实框的交集和并集的比值;表示第i个网格的第j个预测框匹配上了这个目标,如果匹配,否则为0;表示第i个网格的第j个预测框不匹配该目标;是第i个网格边界框的真实置信度,c是第i个网格边界框预测的置信度;是真实的条件类别概率,Pi(c)是网络预测的条件类别概率;loss(BCE)是指二元交叉熵损失;λbox是指定位损失的权重系数,λclass是指分类损失的权重系数;而置信度损失由两部分组成,正样本置信度损失和负样本置信度损失,λobj是指正样本置信度损失的权重系数,λnoobj是指负样本置信度损失的权重系数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于仲恺农业工程学院,未经仲恺农业工程学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110838756.3/1.html,转载请声明来源钻瓜专利网。