[发明专利]一种普适性轻量级深度学习车辆检测方法在审
申请号: | 202110459491.6 | 申请日: | 2021-04-27 |
公开(公告)号: | CN113177560A | 公开(公告)日: | 2021-07-27 |
发明(设计)人: | 蔡雪莲;罗贸峰;左沛昂;岳文伟;张和和;李长乐 | 申请(专利权)人: | 西安电子科技大学 |
主分类号: | G06K9/46 | 分类号: | G06K9/46;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 陕西电子工业专利中心 61205 | 代理人: | 陈宏社;王品华 |
地址: | 710071*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 普适性 轻量级 深度 学习 车辆 检测 方法 | ||
1.一种普适性轻量级深度学习车辆检测方法,其特征在于,包括如下步骤:
(1)获取训练样本集I和测试样本集F:
从数据集中获取N幅包括车辆的图像,并将其中的M幅图像及其对应的包含车辆位置信息标注框的标签数据作为训练样本集I,将其余N-M幅作为测试样本集F,其中N>10000,M>N/2;
(2)构建改进的YOLOv4网络模型H:
(2a)构建改进的YOLOv4网络模型H的结构:
构建包括级联的主干特征提取网络、空间金字塔池化网络和路径聚合网络的改进的YOLOv4网络模型H,其中,主干特征提取网络包括级联的深度可分离卷积模块、多个步长为2的第一瓶颈模块、多个步长为1的第二瓶颈模块以及卷积层,深度可分离卷积模块包括级联的深度卷积层、归一化层、激活层和逐点卷积层,第一瓶颈模块包括级联的深度卷积层、卷积层、归一化层以及激活层,第二瓶颈模块包括级联的第一瓶颈模块和通道混洗模块;空间金字塔池化网络包括依次层叠的多个不同尺寸的最大池化层;路径聚合网络包括多个深度可分离卷积模块、多个上采样层以及多个下采样层;主干特征提取网络中倒数第一个步长为2的第一瓶颈模块和倒数第四个的步长为2的第一瓶颈模块,以及空间金字塔池化网络的输出层与路径聚合网络相连;
(2b)构建改进的YOLOv4网络模型H的损失函数L:
L=L1+L2+L3
其中,L1为预测框中心点坐标的损失函数,L2为预测置信度的损失函数,L3为预测类别的损失函数,IoU为标注框和预测框的交并比,ρ2(b,bgt)表示预测框的中心点和标注框的中心点两点之间的欧拉距离,d表示包含标注框和预测框的外界矩形对角线的距离,w、h分别为预测框的宽和高,wgt、hgt分别为标注框的宽和高,S×S表示图像被划分成网格的大小,表示判断网格内是否存在车辆目标,表示网络预测车辆的概率,pi(c)表示第i网格存在车辆的概率,B表示每个网格预测的边框数,为预测框的置信度,Ci为第i个网格边界框的置信度,λnoobj为权重系数;
(3)对改进的YOLOv4网络模型H进行迭代训练:
(3a)将训练样本集I中的M幅图像划分为n组,每组包括D幅图像,并以为比例对每组中的每幅图像进行压缩,然后将每组中的D幅压缩图像拼接成与原图像尺寸相同的图像,最后将n幅拼接图像与训练样本集I中未被分组的M-nD幅图像混合成数据增强后的训练样本集I′,其中,D∈{4,16,64,...},nD<M,n≥1;
(3b)设迭代次数为t,最大迭代次数为T,T≥50000,第t次迭代的改进的YOLOv4网络模型为Ht,并令t=1,Ht=H;
(3c)将数据增强后的训练样本集I′作为改进的YOLOv4网络模型Ht的输入,主干特征提取网络对I′中的每幅图像进行车辆特征提取,得到每幅图像的三种不同尺度特征图,空间金字塔池化网络对最小尺度特征图进行特征增强,得到增强后的特征图,路径聚合网络对增强后的特征图与主干特征提取网络提取的除最小尺度特征图以外的其余两幅特征图进行多尺度特征融合,得到n幅拼接图像和M-nD幅原图像的标签集Z={Z1,Z2,...,Zk,...,ZK},其中,K=n+M-nD,Zk表示由第k幅数据增强后的训练样本集图像的车辆类别预测标签车辆置信度预测标签和车辆预测框位置标签组成的标签集;
(3d)采用损失函数L,并通过Zk计算改进的YOLOv4网络模型Ht的损失值,然后对K个损失值进行均值处理,得到第t次迭代后Ht的损失值Lt;
(3e)采用反向传播算法,并根据Lt对改进的YOLOv4网络模型Ht中的深度卷积层的卷积核参数λt和逐点卷积层的卷积核参数θt进行更新,得到第t次训练后的Ht;
(3f)判断t=T是否成立,若是,得到训练好的改进的轻量级YOLOv4网络模型H*,否则,令t=t+1,并执行步骤(3c);
(4)获取车辆检测结果:
将测试样本集F作为训练好的改进的轻量级YOLOv4网络模型H*的输入,主干特征提取网络对F中的每幅图像进行车辆特征提取,得到每幅图像的三种不同尺度特征图,空间金字塔池化网络对最小尺度特征图进行特征增强,得到增强后的特征图,路径聚合网络对增强后的特征图与主干特征提取网络提取的除最小尺度特征图以外的其余两幅特征图进行多尺度特征融合,得到N-M幅F的标签集Z*。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110459491.6/1.html,转载请声明来源钻瓜专利网。