[发明专利]一种基于卷积神经网络的甘蔗蔗节特征识别与定位方法有效
申请号: | 201910570675.2 | 申请日: | 2019-06-28 |
公开(公告)号: | CN110288033B | 公开(公告)日: | 2023-04-07 |
发明(设计)人: | 李尚平;李向辉;文春明;廖义奎;李凯华;袁泓磊;张可;张伟;黄宗晓;向锐 | 申请(专利权)人: | 广西民族大学;广西大学 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/82;G06V10/762;G06T7/00;G06N3/0464;G06N3/08 |
代理公司: | 北京汇捷知识产权代理事务所(普通合伙) 11531 | 代理人: | 张丽 |
地址: | 530000 广西*** | 国省代码: | 广西;45 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 卷积 神经网络 甘蔗 特征 识别 定位 方法 | ||
1.一种基于卷积神经网络的甘蔗蔗节特征识别与定位方法,其特征在于,所述方法包括如下步骤:
步骤1:通过摄像装置对甘蔗进行图像采集,得到采集图像;
步骤2:使用标注工具对甘蔗图片进行甘蔗标记,识别蔗节特征,制作训练集,训练集包括输入照片以及对应的蔗节特征分类标签;
步骤3:将训练集输入卷积神经网络中,使用改进的卷积神经网络进行训练,训练迭代学习输出最优深度学习模型,得到权重参数文件;
步骤4:启动甘蔗蔗节特征识别,对摄像头采集的视频进行处理,保存为图片,并设置照片的读取速度,将图片输入学习模型进行识别定位,输出甘蔗边框像素坐标数据;
步骤5:对识别后的甘蔗边框像素坐标数据进行处理,得到实际蔗节位置并将数据传给后续甘蔗种子切割装置对甘蔗种子切割;
所述步骤3的具体过程为:
网络参数初始化,加载设置好的超参数与模型配置文件,将训练集数据输入卷积神经网络中,其中,输入图片的结构是3通道416*416像素尺寸的图片,通过传入输入层图片数据、每层的边界框数和类别数,调用网络核心方法,构建网络模块,网络为全卷积层,含有残差网络结构,通过正向传播训练输出最优损失函数,并使用随机梯度下降方法优化反向传播过程,更新权重偏置参数,训练迭代学习输出深度学习模型,得到权重参数文件分批次训练数据;
所述网络是由卷积层以不同形式链接形成的残差网络,由一种组合形式的卷积操作以不同组合构成,这种组合由一个卷积层,一个批正则化层与一个以带泄露的线性修正函数为激活函数的网络层的结合构成,组合包括卷积操作,卷积操作之后的数据批正则化操作以及对数据进行输入到激活函数中的操作,整个网络将这种组合形式的卷积结构两个或多个相连构成一个小型结构,这种小型结构中的前后两个卷积层使用的卷积核维度不同,使用1*1的卷积层与3*3卷积层交替组成,达到神经网络深度的增加,之后将这种小型结构的输出结果与前层小型网络或者卷积结构输出相加,构成残差网络结构short连接形式,并输入线性单元激活函数,最后图像信息数据经过1*1卷积核的卷积层输入线性激活函数,将输出结果输出,网络共由22部分构成,每一部分中包含的卷积核的数量以及结构不同,在网络模型中,最后蔗节信息为一个输出值,输出值由三个输出值通过重合度计算得到,三个输出值均由卷积操作后输入激活函数输出得到,每个输出值包含10种预测框对应值,输出值的过程中使用非极大值抑制保证对每个对象只检测一次,找出概率最大的边界框,通过维度聚类方法来预测边界框并用逻辑回归预测对象分数,每个边界框对应四个数据,分别为中心点坐标以及边界框的宽度与高度,训练中使用二元交叉熵对生成的边界框在进行分类预测,确定边界框中物体类别,最后输出值为蔗节预测框坐标值;
所述重合度计算的具体过程为:
引入重合度C来表示获取的最优甘蔗蔗节预测框A与蔗节预测框B的重合度,只有重合度超过阈值的预测框才能被识别认定为正确目标,通过两者预测框计算得到的阈值筛选出最优蔗节位置,
预测框重合度C为:
C=(A∩B)/A
将所有最优甘蔗蔗节预测框A与蔗节预测框B计算获得甘蔗蔗节预测框的重合度C,将重合度C超过阈值的蔗节预测框输出,作为需要的目标,采用K-means聚类方法,对甘蔗数据集进行处理得到预测框的尺寸,并提高了预测框数量,在训练时达到更有效果,使用时对于甘蔗特征的识别定位更准确。
2.根据权利要求1所述的一种基于卷积神经网络的甘蔗蔗节特征识别与定位方法,其特征在于:所述步骤1的具体过程为:
使用摄像装置对甘蔗进行视频采样,得到甘蔗采样视频,对采样视频进行帧处理得到采样图像,并设置图片尺寸,其中采样的甘蔗使用不同品种,不同颜色。
3.根据权利要求1所述的一种基于卷积神经网络的甘蔗蔗节特征识别与定位方法,其特征在于:所述步骤2的具体过程为:
使用标记工具对甘蔗图片进行人工标记,标记关键特征点,即整根甘蔗以及甘蔗特征,通过关键特征点定位,特征点的特性必须在所有图片中保持一致,并且所有标签在所有图片中必须保持一致,之后生成标记文件,文件内含甘蔗图像蔗节位置像素点坐标以及甘蔗特征的分类标签,即包含神经网络要预测的对象分类标签与表示边界框的四个数字,分别为中心点坐标以及边界框的宽与高。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广西民族大学;广西大学,未经广西民族大学;广西大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910570675.2/1.html,转载请声明来源钻瓜专利网。