[发明专利]一种基于改进YOLOv3的树上果实识别方法有效
申请号: | 202011293795.1 | 申请日: | 2020-11-18 |
公开(公告)号: | CN112329697B | 公开(公告)日: | 2022-04-12 |
发明(设计)人: | 陆声链;刘晓宇;李帼;陈文康 | 申请(专利权)人: | 广西师范大学 |
主分类号: | G06V20/10 | 分类号: | G06V20/10;G06V10/762;G06V10/774;G06V10/82;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 桂林市华杰专利商标事务所有限责任公司 45112 | 代理人: | 杨雪梅 |
地址: | 541004 广西壮*** | 国省代码: | 广西;45 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 改进 yolov3 树上 果实 识别 方法 | ||
本发明公开了一种基于改进YOLOv3的树上果实识别方法,包括如下步骤:S1、图像的获取;S2、图像预处理;S3、设置网络模型参数;S4、对原YOLOv3网络结构进行改进,得到改进后的YOLOv3网络结构;S5、训练网络模型;S6、运用训练完成的网络模型权重进行识别。这种方法可以精准识别大面积聚簇重叠的树上果实,识别精度高、速度快,能满足实时识别的需要。
技术领域
本发明涉及目标检测技术领域,具体是一种基于改进YOLOv3的树上果实识别方法。
背景技术
我国是世界水果生产大国,水果种类位于世界排名前列,栽培面积位居世界第一。喷药、水果采摘、采后分拣等作业果树生产的重要环节,当前我国实际生产中,限于技术及经济投入等因素,这些作业大多数都依靠人工完成,使得我国水果生产的成本居高,效率低下。近年来,随着信息技术的迅猛发展,不少研究者借助计算机视觉识别技术辅助进行果园产量评估、自动采摘、病害防控和水果分拣等应用,其中果实的识别和定位是核心技术之一。然而,由于在果园环境下易受光照、气候、风等自然条件的影响,所以自然条件下树上果实的识别和定位尚存在较多问题,成为果园水果自动采摘、产量评估等应用自动化的主要制约因素之一。
为此,大量研究者围绕果园果实的自动识别与定位问题开展了许多研究,并提出了一些解决方法。其中,前期较多的研究是基于图像特征的提取方法,主要考虑图像的颜色特征、纹理特征、形状特征和空间关系特征。基于颜色直方图特征匹配方法主要有直方图相交法、参考颜色表法等,由于颜色无法衡量图像的方向和大小,所以不能很好提取图像的局部特征。基于纹理特征提取常用的方法是灰度共生矩阵法和半方差图,常用的模型有随机场模型和分形模型,而纹理是居于区域的概念,所以会导致过度区域化而忽略了全局特征。基于形状特征提取的方法主要有边界特征法、几何参数法等,而对于形变目标识别效果不佳。部分研究者提出基于机器视觉的果实自动识别技术,根据机器视觉原理, 进行图像采集。将果实的图像进行平滑、锐化等预处理后,在RGB颜色空间内计算果实颜色样本值, 并根据样本值进行图像分割, 最后利用分割的结果进行特征提取。使用这种方法,果实识别的准确率接近90%。
近年来,人工智能技术,尤其是深度学习兴起,在计算机视觉领域引起了突破性的变革。有研究者提出了基于卷积神经网络的果实识别方法,并相继实现了Fast R-CNN、YOLO等目标检测算法。这类方法通常首先获取果实的RGB图片,并进行预处理和标注,构建数据集,搭建好卷积神经网络,设置好网络模型的参数后,将训练集放入卷积神经网络进行训练,最后就能得到果实识别模型。现有基于卷积神经网络的果实识别方法中,一个缺点是在识别树上果实时,过于注重对小目标的识别精度,没有考虑卷积神经网络的深度和检测速度;另一个不足是面对聚簇和重叠的树上果实目标时,无法做到精准识别,存在误识别。
果园生长中果实的个体、颜色等特征随着生长周期而表现出差异,即使同一品种的果树,生长出的果实拥有不同特征、姿态和遮挡程度等,不同品种的果树更是有不同的性状特征。此外,在果实的生长过程中,光照强弱、水肥管理方式、病虫害等复杂环境因素都会影响最终树上果实的识别。因此,在果园环境下识别树上果实时,十分需要将果实自身的因素和果园复杂环境的影响考虑在内。
发明内容
本发明的目的是针对现有技术的不足,而提供一种基于改进YOLOv3的树上果实识别方法。这种方法可以精准识别大面积聚簇重叠的树上果实,识别精度高、速度快,能满足实时识别的需要。
实现本发明目的的技术方案是:
一种基于改进YOLOv3的树上果实识别方法,包括如下步骤:
S1、图像的获取:用户使用数码相机或其他图像采集设备对结有果实的果树进行图像采集,图像采集时间包括果实生长早期、中期和成熟期的不同阶段,拍摄图像的时间点分布在早上、中午、下午不同时段,以便所拍摄的图像中,包括不同时间段的图像,最后将采集到的图像按照Pascal VOC数据集的格式将图片命名,同时创建名为Labeleds、PictureSets、ResultSets的三个文件夹;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广西师范大学,未经广西师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011293795.1/2.html,转载请声明来源钻瓜专利网。