[发明专利]一种基于YOLOv5改进的行人检测算法在审
申请号: | 202310392926.9 | 申请日: | 2023-04-13 |
公开(公告)号: | CN116563885A | 公开(公告)日: | 2023-08-08 |
发明(设计)人: | 韦鹏程;曾玉山 | 申请(专利权)人: | 重庆第二师范学院 |
主分类号: | G06V40/10 | 分类号: | G06V40/10;G06V10/80;G06V10/82;G06N3/0464;G06N3/08 |
代理公司: | 重庆一叶知秋专利代理事务所(普通合伙) 50277 | 代理人: | 曲晓欢 |
地址: | 400000 重*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 yolov5 改进 行人 检测 算法 | ||
1.一种基于YOLOv5改进的行人检测算法,其特征在于:将复杂的网络模块化,具体包括特征提取网络、特征融合网络和网络的检测头;利用特征提取网络提取图像的不同深度特征;利用特征融合网络先从顶层特征向底层特征融合,再从底层特征向顶层特征融合;利用网络的检测头检测小、中、大目标,并输出3个特征向量进行通道上的堆叠,再通过非极大值抑制操作得到检测结果。
2.根据权利要求1所述的一种基于YOLOv5改进的行人检测算法,其特征在于:特征提取网络和特征融合网络均包括多个卷积模块和C3模块,特征提取网络还包括一个特征金字塔模块。
3.根据权利要求2所述的一种基于YOLOv5改进的行人检测算法,其特征在于:卷积模块均包括卷积层、BatchNormalization层和SILU激活函数。
4.根据权利要求3所述的一种基于YOLOv5改进的行人检测算法,其特征在于:C3模块是一个残差网络结构,其BottleNeck的个数为3。
5.根据权利要求4所述的一种基于YOLOv5改进的行人检测算法,其特征在于:C3模块的BottleNeck包括BottleNeck1和BottleNeck2两种形式,BottleNeck1为两个卷积模块构成的残差网络结构,BottleNeck2为两个卷积模块直接相连,没有残差连接。
6.根据权利要求5所述的一种基于YOLOv5改进的行人检测算法,其特征在于:特征提取网络里的C3模块使用的是BottleNeck1,特征融合网络里的C3模块使用的是BottleNeck2。
7.根据权利要求6所述的一种基于YOLOv5改进的行人检测算法,其特征在于:特征融合网络还包括CBAM模块。
8.根据权利要求7所述的一种基于YOLOv5改进的行人检测算法,其特征在于:优化训练过程中的定位损失函数的定位损失度量标准为LLoc=η1LGIOU+η2LDIOU;
η1,η2满足如下条件,
9.根据权利要求8所述的一种基于YOLOv5改进的行人检测算法,其特征在于:具体操作步骤如下,
步骤一,先进行数据增强,再将图像输入网络;
步骤二,将输入的图像调整到640×640×3,再输入到特征提取网络Backbone中,经过前两个卷积模块后,输出320×320×64的特征向量;
步骤三,使用一个C3模块,输出160×160×128的特征向量;
步骤四,使用一个卷积模块,输出80×80×256的特征向量;
步骤五,使用一个C3模块,输出80×80×256的特征向量;
步骤六,使用一个卷积模块,输出40×40×512的特征向量;
步骤七,使用一个C3模块,输出40×40×512的特征向量;
步骤八,使用一个卷积模块,输出20×20×1024的特征向量;
步骤九,使用一个C3模块,输出20×20×1024的特征向量;
步骤十,使用一个特征金字塔模块,输出20×20×1024的特征向量;
步骤十一,步骤十输出的特征向量经过一个卷积模块和CBAM模块后,维度变为20×20×512,通过上采样,输出为40×40×512,再与步骤7中的输出进行融合,输出40×40×1024的特征向量;
步骤十二,使用一个C3模块,输出40×40×512的特征向量;
步骤十三,步骤十二输出的特征向量经过一个卷积模块和CBAM模块后,维度变为40×40×256,通过上采样,输出为80×80×256,再与步骤五中的输出进行融合,输出80×80×512的特征向量,完成自顶向底的特征融合;
步骤十四,使用一个C3模块,输出80×80×256的特征向量;
步骤十五,步骤十四输出的特征向量经过一个卷积模块后,维度变为40×40×256,再与步骤十三中的40×40×256的特征向量进行融合,输出40×40×512的特征向量;
步骤十六,使用一个C3模块,输出40×40×512的特征向量;
步骤十七,步骤十六输出的特征向量经过一个卷积模块后,维度变为20×20×512,再与步骤十一中的20×20×512的特征进行融合,输出20×20×2024的特征向量,完成自底向顶的特征融合;
步骤十八,使用一个C3模块,输出20×20×2024的特征向量;
步骤十九,步骤十四、步骤十六、步骤十八的输出为特征融合网络的输出,即3种尺度的特征,将这3个特征向量进行通道上的拼接便得到最终的目标检测结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆第二师范学院,未经重庆第二师范学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310392926.9/1.html,转载请声明来源钻瓜专利网。