[发明专利]一种基于DC-SPP-YOLO的图像目标检测方法有效
申请号: | 201811633166.1 | 申请日: | 2018-12-29 |
公开(公告)号: | CN109685152B | 公开(公告)日: | 2020-11-20 |
发明(设计)人: | 王建林;黄展超;邱科鹏 | 申请(专利权)人: | 北京化工大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 北京思海天达知识产权代理有限公司 11203 | 代理人: | 沈波 |
地址: | 100029 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 dc spp yolo 图像 目标 检测 方法 | ||
1.一种基于DC-SPP-YOLO的图像目标检测方法,其特征在于:该方法具体包括以下步骤:
步骤一:采用图像几何变换数据增强方法对训练样本进行预处理并构建训练数据集,以训练图像目标边界框与聚类中心目标边界框的重合度作为聚类距离指标,采用k-means聚类算法选取训练样本中主要的若干类边界框尺寸作为预测目标边界框的先验信息;
步骤二:构建YOLOv2目标检测网络模型,将卷积层连接方式由逐层连接改进为密集连接,对卷积层输入数据进行批归一化并采用LeakyReLU激活函数进行非线性化,在卷积模块与目标检测层之间引入空间金字塔池化模块汇聚多尺度图像局部区域特征;
步骤三:以目标位置和类别预测的最小平方和误差为训练目标构建损失函数,根据步骤一获得的训练数据集和目标边界框先验信息,训练步骤二所构建的DC-SPP-YOLO目标检测模型直至损失函数收敛;
步骤四:输入被测目标图像,利用所训练的DC-SPP-YOLO模型检测图像中的目标,输出图像中每个目标的边界框位置、尺寸以及目标类别;
训练步骤二所构建DC-SPP-YOLO目标检测模型,使其学习预测目标位置和类别,设预测的边界框中心相对于其所在网格左上角坐标与网格边长的比值分别为tx和ty,采用Sigmoid激活函数
约束预测值,将其归一化为σ(tx)和σ(ty);设边界框宽、高相对于先验框宽、高的比值取对数为tw和th;边界框相对先验框的目标置信度为tc,归一化为σ(tc);边界框中心点所在网格左上角坐标为(Cx,Cy);先验框的宽和高分别为pw和ph;则边界框的中心点坐标(bx,by)、宽bw、高bh和置信度bc分别为
bx=σ(tx)+Cx (15)
by=σ(ty)+Cy (16)
bc=σ(tc) (19)
预测的边界框输出最终表示为b=[bx,by,bw,bh,bc]T;同理,训练集中目标边界框的真实信息表示为g=[gx,gy,gw,gh,gc]T;目标的分类情况表示为Class=[Class1,Class2,…,ClassC]T,目标属于各类的实际概率为Pr(Classl)l∈C,模型预测的目标属于各类的概率为
采用最小平方和误差构建目标预测的损失函数:
其中W、H分别为特征图每列和每行的网格数;和表示指示函数;当预测框与实际框的最大值大于阈值IoUthres时认为该预测框包含目标,否则认为该预测框不包含目标,表示对Sigmoid函数求导后的函数,由于bx、by和bc分别采用Sigmoid激活函数约束的预测值,因此在反向传播计算损失过程中会出现项;λnoobj、λobj、λcoord和λclass分别为各部分损失的权重系数;在前Nprior个训练样本中引入损失项,计算没有提供实际框有效预测的先验框与预测边界框之间的损失;其中λprior为该项损失的权重系数,先验框的位置和尺度参数表示为prior=[priorx,priory,priorw,priorh]T;训练深度卷积神经网络直至损失函数收敛,获得DC-SPP-YOLO目标检测模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京化工大学,未经北京化工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811633166.1/1.html,转载请声明来源钻瓜专利网。