[发明专利]基于改进YOLOv3的自然场景下路面裂缝检测和分类方法在审
申请号: | 202111243492.3 | 申请日: | 2021-10-25 |
公开(公告)号: | CN116030266A | 公开(公告)日: | 2023-04-28 |
发明(设计)人: | 朱纤纤;王琴;丁军娣 | 申请(专利权)人: | 南京理工大学 |
主分类号: | G06V10/44 | 分类号: | G06V10/44;G06Q50/08;G06V10/762;G06V10/774;G06V10/764;G06V10/82;G06N3/045;G06N3/0464;G06N3/047;G06N3/067 |
代理公司: | 南京理工大学专利中心 32203 | 代理人: | 朱炳斐 |
地址: | 210094 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 改进 yolov3 自然 场景 路面 裂缝 检测 分类 方法 | ||
本发明公开了一种基于改进YOLOv3的自然场景下路面裂缝检测和分类方法。该方法采用聚类算法对实例进行分析获取新的最佳先验尺寸,并在YOLOv3特征提取网络后加入SPP模块,融合局部和全局特征,更好地捕获低层细粒度特征的信息,提高了小目标检测能力,有效减少裂缝目标过小造成的漏检问题;选取CIoU作为改进的边界框损失函数,在考虑预测框与真实框重叠面积的同时,还考虑到锚框的中心点距离和长宽比,对裂缝的定位准确度有所提升;对于正负样本不均衡问题,以Focal Loss取代交叉熵作为改进的置信度损失函数,进一步提高裂缝检测和分类的性能,达到了最优的检测效果。与原YOLOv3方法对比,本方法的检测精度和速度更高。
技术领域
本发明属于目标识别领域,特别涉及一种基于改进YOLOv3的自然场景下路面裂缝检测和分类方法。
背景技术
路面裂缝检测一直是视觉研究的一个活跃领域。因气候、年久老化等因素,道路常常会产生裂缝,这不仅会降低路面性能,还会威胁到路面安全,政府每年都需要在道路维修上投入大量资金。因此,高效准确地检测路面裂缝具有重要的现实意义。
然而,在实际生活中,当道路管理人员需要修复某类裂缝时,要先清楚地了解裂缝的类型才能采取有效的行动。因此,裂缝检测任务在两个方面具有挑战性:首先,需要一种鲁棒的裂缝检测算法来定位不同天气或光照条件下的特定裂缝;其次,该算法能够区分不同类型的重叠的裂缝。
早期,研究人员通常采用传统的裂缝检测方法,如阈值法、边缘检测法、形态学方法等,其主要问题是容易受到噪声等因素的干扰,不能满足不同条件下的检测需要,鲁棒性较差。近年来,基于机器学习的裂缝检测方法越来越受到重视,包括支持向量机、随机森林等,而随着深度卷积神经网络(Convolutional Neural Network,CNN)的出现,许多基于CNN的目标检测算法开始发展,可根据其设计原理分为两种类型:一是以区域卷积网络(RegionConvolutional Neural Network,R-CNN)系列为代表的两阶段目标检测模型,但由于CNN的重复评估,速度缓慢,不适合实时应用;另一种是以YOLO系列和SSD(Single Shot multiboxDetector)为代表的单阶段检测模型。利用YOLO算法来检测路面裂缝,打破了R-CNN的限制,直接将整张图片作为输入,从而极大地加快了网络的训练速度,但也损失了一定的准确性。YOLOv2算法进行路面裂缝检测,通过去掉随机失活层而采用批归一化层提高了目标识别的准确率。YOLOv3则在YOLOv2的基础上进行了改进,采用残差模型和特征金字塔网络架构,极大地提升了网络性能,在VOC、COCO等数据集上取得了巨大的进展,其检测速度和准确率都更高。VOC、COCO这类数据集中不同的实例易于区分,例如椅子,汽车,人等。然而,不同于VOC、COCO这类数据集,大多数路面裂缝为细长线型,定位较为困难,当目标过小时还会出现漏检,且不同类型的裂缝容易混淆,存在大量的裂缝重叠,因此在路面裂缝检测和分类的应用中,YOLOv3算法仍需进一步优化。
发明内容
本发明的目的在于针对上述现有技术存在的问题,提供一种基于改进YOLOv3的自然场景下路面裂缝检测和分类方法。
实现本发明目的的技术解决方案为:一种基于改进YOLOv3的自然场景下路面裂缝检测和分类方法,所述方法包括以下步骤:
步骤1,对自然场景下的路面裂缝数据集进行处理,划分训练集和测试集,并对训练集进行数据增强;
步骤2,构建改进的YOLOv3网络模型;
步骤3,训练改进的YOLOv3网络模型;
步骤4,利用训练好的改进的YOLOv3网络模型,对测试集进行路面裂缝检测和分类。
进一步地,步骤1所述对自然场景下的路面裂缝数据集进行处理,划分训练集和测试集,并对训练集进行数据增强,具体包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京理工大学,未经南京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111243492.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:加氢处理催化剂及其制备方法和应用
- 下一篇:一种生产低硫石油焦的方法