[发明专利]一种基于改进YOLOv3算法的行人检测系统及方法有效
申请号: | 202010591050.7 | 申请日: | 2020-06-24 |
公开(公告)号: | CN111898432B | 公开(公告)日: | 2022-10-14 |
发明(设计)人: | 李军;王茂琦;李浩;徐康民;程光皓 | 申请(专利权)人: | 南京理工大学 |
主分类号: | G06V40/10 | 分类号: | G06V40/10;G06V10/82;G06V10/80;G06V10/764;G06N3/04;G06N3/08 |
代理公司: | 南京理工大学专利中心 32203 | 代理人: | 薛云燕 |
地址: | 210094 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 改进 yolov3 算法 行人 检测 系统 方法 | ||
1.一种基于改进YOLOv3算法的行人检测方法,其特征在于,所采用的系统包括特征提取模块和行人检测模块,其中:
所述特征提取模块,使用不同大小的卷积核对输入图像进行特征提取,在每一次下采样的同时增大卷积通道数以获取更多的特征信息,同时在卷积过程中设置快捷链路层组成残差模块,在每个卷积层中包括正则化和激活操作;
所述行人检测模块,用于图像特征融合,使深层特征图与浅层特征图相融合,融合后的特征图再反向融合上一层网络特征图;在特征融合的基础上构建多尺度预测网络结构,增加一个带有3个anchor的YOLO预测层,由4个YOLO预测层对图像中出现的行人进行分类回归;
步骤如下:
首先,对原始的YOLOv3特征提取网络进行裁剪,得到裁剪后的特征提取网络;
然后,基于裁剪后的特征提取网络,在YOLO预测层使用不同大小的特征图进行特征融合,使深层特征图与浅层特征图相融合;
最后,在网络输出中添加一个YOLO预测层,由4个YOLO预测层对图像中出现的行人进行分类回归;
所述对原始的YOLOv3特征提取网络进行裁剪,得到裁剪后的特征提取网络,具体包括以下步骤:
步骤1.1、输入图像重新调整大小为416×416;
步骤1.2、使用16×3×3的卷积核对输入图像进行卷积操作,卷积步长为1,其中第一位数字16表示卷积核通道数,后两位数字3×3表示卷积核大小,每一次的卷积过程如下所示,首先对图像进行特征提取,然后进行归一化和激活操作;
给定一个输入图像X=Rn×n,和卷积核K=Rk×k,kn,其中n×n表示输入图像大小,k×k表示卷积核大小,R为实数集;卷积操作如下式所示,yij表示卷积输出图在下标值i,j处的像素值,wuv表示对应的卷积核中在下标值u,v处的像素值,xi-u+1,j-v+1表示输入图像X在i-u+1,j-v+1处的像素值:
对于第l层净输入y(l),其标准归一化如下式所示,其中E(y(l))和var(y(l))是指当前参数下y(l)的每一维在整个训练集上的期望和方差,为第l层归一化后的输出:
激活函数采用Leaky ReLU函数,公式如下所示,x表示输入,a取很小的正实数:
步骤1.3、使用32×3×3的卷积核对上一层输出特征图进行降采样,卷积步长为2;
步骤1.4、使用16×1×1和32×3×3的卷积核组成一个卷积残差模块相继对上层输出特征图进行特征提取,卷积步长为1;在卷积残差模块中,假设输入为x,期望输出为H(x),首先使用通道数为n的1×1卷积核对输入x进行降维处理,然后再使用通道数为2n的3×3卷积核对输入进行特征提取,最后直接把输入x传到输出作为初始结果,此时期望学习目标为F(x)=H(x)-x;
步骤1.5、使用64×3×3的卷积核对上一层输出特征图进行降采样,卷积步长为2;
步骤1.6、使用2组由32×1×1和64×3×3的卷积核组成一个卷积残差模块相继对上层输出特征图进行特征提取,卷积步长为1;
步骤1.7、使用128×3×3的卷积核对上一层输出特征图进行降采样,卷积步长为2;
步骤1.8、使用8组由64×1×1和128×3×3的卷积核组成一个卷积残差模块相继对上层输出特征图进行特征提取,卷积步长为1;
步骤1.9、使用256×3×3的卷积核对上一层输出特征图进行降采样,卷积步长为2;
步骤1.10、使用8组由128×1×1和256×3×3的卷积核组成一个卷积残差模块相继对上层输出特征图进行特征提取,卷积步长为1;
步骤1.11、使用512×3×3的卷积核对上一层输出特征图进行降采样,卷积步长为2;
步骤1.12、使用4组由256×1×1和512×3×3的卷积核组成一个卷积残差模块相继对上层输出特征图进行特征提取,卷积步长为1。
2.根据权利要求1所述的基于改进YOLOv3算法的行人检测方法,其特征在于,所述基于裁剪后的特征提取网络,在YOLO预测层使用不同大小的特征图进行特征融合,使深层特征图与浅层特征图相融合;最后,在网络输出中添加一个YOLO预测层,由4个YOLO预测层对图像中出现的行人进行分类回归,具体包括以下步骤:
步骤2.1、将最后一层特征图进行连续卷积操作,提取特征图,然后输入YOLO预测层进行分类回归;
步骤2.2、将特征提取网络最后一层特征图进行2倍上采样,然后与第五次下采样层前一层特征图进行concat特征融合,最后将融合后的特征图进行连续卷积操作,输入YOLO预测层进行分类回归;其中上采样使用的为最邻近插值算法,concat特征融合如下式所示:
假设两路输入的通道分别为C1×W×H和C2×W×H,C为输入通道数,W、H分别是特征图宽度和高度,那么concat特征融合的输出Zconcat为:
Zconcat=(C1+C2)×W×H
步骤2.3、首先将步骤2.2中融合后的特征图进行2倍上采样,与第四次下采样层前一层特征图进行concat融合,然后将融合后的特征图与步骤2.1中输出的特征图进行4倍上采样后再进行concat融合,最后输入YOLO检测层进行分类回归;
步骤2.4、首先将步骤2.3中融合后的特征图进行2倍上采样,与第三次下采样层前一层特征图进行concat融合,然后将融合后的特征图与步骤2.2中输出的特征图进行4倍上采样后再进行concat融合,最后输入YOLO检测层进行分类回归。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京理工大学,未经南京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010591050.7/1.html,转载请声明来源钻瓜专利网。