[发明专利]一种基于卷积神经网络的果实生长形态视觉辨识方法有效
申请号: | 202111067533.8 | 申请日: | 2021-09-13 |
公开(公告)号: | CN113837039B | 公开(公告)日: | 2023-10-24 |
发明(设计)人: | 吕继东;许浩;徐黎明;李文杰;邹凌;戎海龙;杨彪;马正华 | 申请(专利权)人: | 常州大学 |
主分类号: | G06V20/68 | 分类号: | G06V20/68;G06V10/82;G06V10/774;G06N3/0464;G06N3/048;G06N3/084 |
代理公司: | 常州市英诺创信专利代理事务所(普通合伙) 32258 | 代理人: | 王美华 |
地址: | 213164 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 卷积 神经网络 果实 生长 形态 视觉 辨识 方法 | ||
1.一种基于卷积神经网络的果实生长形态视觉辨识方法,其特征在于,包括以下步骤:
S1、图像采集:采集果园不同形态的果实图像,并对图像进行标注,所述不同形态的果实图像包括:无枝茎遮挡单个果实、枝茎遮挡单个果实、无枝茎遮挡重叠果实和枝茎遮挡重叠果实;
S2、图像增强:将采集到的果实图像进行数据增强以扩充数据集,数据增强方法包括饱和度调整、对比度调整、翻转以及清晰度调整,并随机将图像按6:2:2的比例划分为训练集、验证集和测试集;
S3、搭建卷积神经网络模型:通过1个图像预处理模块、12个卷积模块、1个空间金字塔池化层、4个上采样模块、8个特征融合块、12个C3模块和1个检测模块组成,网络首先经过4个卷积模块进行下采样,在第二个和第三个卷积模块后均添加9个C3网络,经过下采样处理后送入空间金字塔池化层,并在池化层后插入3个C3网络;然后进行上采样操作,上采样操作包括2个卷积模块和2个上采样模块,每个上采样模块后插入3个C3网络;完成上采样后重复下采样和上采样的操作,通过2个卷积模块进行下采样,每个卷积模块后面插入3个C3网络;随后经过2个上采样模块,每个上采样模块后面同样插入3个C3网络和3个卷积模块;随后再经过两个下采样模块,每个下采样模块后插入3个C3网络;最后送入检测模块进行检测,在12个卷积模块中通过混合激活函数来提高神经网络对模型的表达能力;
S4、卷积神经网络模型训练:通过训练集对卷积神经网络模型进行训练,使用SGD优化器对卷积神经网络的权重参数、偏置参数和批归一化的权重参数进行优化,每一次迭代计算mini-batch的梯度,然后使用学习率朝着梯度相反方向去更新模型的每个参数,随着迭代的步骤增多,学习率逐渐减小,直至模型收敛;
S5、果实生长形态辨识:将测试集图像送入步骤4训练完的卷积神经网络模型进行前向传播,返回预测框的具体格式为:中心点+长宽+置信度+分类结果,随后进行NMS操作,设置置信度阈值和IOU阈值,将预测框的中心点和长宽变为:左下角坐标+右上角坐标,最后保存预测结果。
2.如权利要求1所述的基于卷积神经网络的果实生长形态视觉辨识方法,其特征在于,步骤S3的所述混合激活函数公式为:
f(x)=(p1-p2)x·σ[β(p1-p2)x]+p2x (1)
f(x)=xσ(x) (2)
其中,σ是sigmoid函数,p1、p2和β使用的是三个可学习参数来自适应调整,其中,公式(1)为ACON-C激活函数,公式(2)为SiLu激活函数;其中,在下采样里的3×3卷积模块里使用式(1)激活函数,在调整通道的1×1卷积模块里使用式(2)激活函数。
3.如权利要求1所述的基于卷积神经网络的果实生长形态视觉辨识方法,其特征在于,所述模型检测模块通过计算分类损失模型和回归损失模型评估训练模型的优劣,分类损失模型分为正样本的分类损失和正负样本的前景背景预测的分类损失,其中,回归损失模型使用CIOU_Loss计算,分类损失模型分别使用BECLoss和BCEWithLogitsLoss进行计算,将这三个损失值相加作为评估模型优劣的指标,直到损失值不再变化得到最优模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于常州大学,未经常州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111067533.8/1.html,转载请声明来源钻瓜专利网。