[发明专利]一种基于DC-SPP-YOLO的图像目标检测方法有效
申请号: | 201811633166.1 | 申请日: | 2018-12-29 |
公开(公告)号: | CN109685152B | 公开(公告)日: | 2020-11-20 |
发明(设计)人: | 王建林;黄展超;邱科鹏 | 申请(专利权)人: | 北京化工大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 北京思海天达知识产权代理有限公司 11203 | 代理人: | 沈波 |
地址: | 100029 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 dc spp yolo 图像 目标 检测 方法 | ||
本发明公开了一种基于DC‑SPP‑YOLO的图像目标检测方法,首先利用数据增强方法对训练图像样本进行预处理并构建训练样本集,采用k‑means聚类算法选取用于目标边界框预测的先验候选框;然后将YOLOv2模型的卷积层连接方式由逐层连接改进为密集连接,同时在卷积模块与目标检测层之间引入空间金字塔池化,建立DC‑SPP‑YOLO目标检测模型;最后以预测值与真实值之间的误差平方和构建损失函数,迭代更新模型权重参数使得损失函数收敛,获得DC‑SPP‑YOLO模型并用于目标检测。本发明考虑了加深卷积网络引起的“梯度消失”和YOLOv2模型未充分使用多尺度局部区域特征,构建了基于卷积层密集连接和空间金字塔池化改进的DC‑SPP‑YOLO目标检测模型,提高了目标检测精度。
技术领域
本发明涉及一种图像目标检测方法,属于机器视觉技术领域,尤其涉及一种基于密集连接和空间金字塔池化YOLO(Dense Connectivity and Spatial Pyramid PoolingImprovedYou Look Only Once,DC-SPP-YOLO)的目标检测方法。
背景技术
目标检测是机器视觉领域的核心研究内容之一,广泛应用于驾驶导航、工件检测、机械臂抓取等方面。建立并训练高质量的目标检测模型,能够提取更丰富、有效的目标特征,提高在图像或视频中定位和分类目标的准确度。
传统的形变部件模型(Deformable Parts Models,DPM)等目标检测方法通过滑动窗口搜索目标位置,效率低下;提取目标的梯度方向直方图(Histogram of OrientedGradients,HOG)等人工设计特征用于目标分类,难以全面、深层次的表达目标特征信息。深度卷积神经网络因具有良好的特征提取和表达能力被应用于图像目标分类和检测任务,其中的YOLO(You Look Only Once)算法具有目标检测速度快、无需生成推荐区域等优点,实现了图像目标的实时检测。然而,YOLO和YOLOv2法在目标检测精度方面仍然存在局限;当通过加深网络提高模型学习能力时会出现梯度消失现象,YOLOv3算法采用残差连接方式缓解了梯度消失现象但阻碍了网络各层的信息流;同时,YOLOv2和YOLOv3算法的多尺度目标检测偏重于融合不同尺度卷积层的全局特征,忽略了融合同一卷积层不同尺度的局部区域特征;这都制约着目标检测准确度的提高。
因此,本发明充分考虑了加深卷积网络引起的“梯度消失”问题和YOLOv2模型未充分使用多尺度局部区域特征问题,在YOLOv2网络模型中采用卷积层密集连接方式进行改进,同时引入空间金字塔池化汇聚多尺度局部区域特征,构建了DC-SPP-YOLO目标检测模型,提高了目标检测的精度。
发明内容
本发明以提高YOLOv2模型目标检测精度为目的;首先采用数据增强方法对训练样本进行预处理并构建训练数据集,采用k-means聚类算法选取训练样本中主要的若干类边界框尺寸作为预测目标边界框的先验信息;然后构建YOLOv2目标检测网络模型,将卷积层连接方式由逐层连接改进为密集连接,对卷积层输入数据进行批归一化并采用Leaky ReLU激活函数进行非线性化,在卷积模块与目标检测层之间引入空间金字塔池化模块汇聚多尺度图像局部区域特征;最后以目标位置和类别预测的最小平方和误差为训练目标构建损失函数,训练深度卷积网络模型直至损失函数收敛,进而利用所训练的DC-SPP-YOLO模型检测图像目标。DC-SPP-YOLO目标检测流程如图1所示。
本发明采用的技术方案为一种基于DC-SPP-YOLO的图像目标检测方法,该方法具体包括以下步骤:
步骤一:采用图像几何变换等数据增强方法对训练样本进行预处理并构建训练数据集,以训练图像目标边界框与聚类中心目标边界框的重合度作为聚类距离指标,采用k-means聚类算法选取训练样本中主要的若干类边界框尺寸作为预测目标边界框的先验信息;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京化工大学,未经北京化工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811633166.1/2.html,转载请声明来源钻瓜专利网。