[发明专利]一种基于改进YOLOv3模型的行人检测方法及系统在审
申请号: | 202110453896.9 | 申请日: | 2021-04-26 |
公开(公告)号: | CN113205028A | 公开(公告)日: | 2021-08-03 |
发明(设计)人: | 钱惠敏;陈纬;陈啸 | 申请(专利权)人: | 河海大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06F16/951;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 南京纵横知识产权代理有限公司 32224 | 代理人: | 何春廷 |
地址: | 211100 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 改进 yolov3 模型 行人 检测 方法 系统 | ||
1.一种基于改进YOLOv3模型的行人检测方法,其特征在于,包括:
获取自动驾驶场景下实时采集的监控场景视频,从视频中提取图像帧;
将图像帧输入到预先训练好的改进YOLOv3模型,利用改进YOLOv3模型对图像帧中是否包含行人进行判断,若是则用边界框标记,若否则不做任何处理;
所述改进YOLOv3模型的改进包括:
在YOLOv3模型的ResNet34的网络结构的卷积块的近道连接上依次添加平均池化层和卷积层,得到ResNet34-D,并作为改进YOLOv3模型的的主干网络;
在YOLOv3模型的多特征融合网络中增加空间金字塔池化层,用于提取不同感受野的特征并进行融合;
在YOLOv3的多特征融合网络的输出层增加DropBlock模块,用于随机删除一部分输出层中固定大小的整片区域神经单元,利用保留下来的神经元集中学习剩余部分的特征表示;
利用DIoU损失函数代替YOLOv3模型中原先边框位置损失函数。
2.根据权利要求1所述的基于改进YOLOv3模型的行人检测方法,其特征在于,所述改进YOLOv3模型的训练过程包括:
使用从网络中下载的ImageNet数据集训练ResNet34_D网络,得到ResNet34_D网络的权重文件;
利用所述ResNet34_D网络的权重文件初始化改进Y0L0v3模型的主干网络的网络参数;
获取自动驾驶场景下的历史行人图像,根据历史行人图像构建初始数据集,对初始数据集中的图像进行标注,得到行人数据集,按随机方式从行人数据集中选择训练集和验证集;
根据训练集和所述DIoU损失函数,利用梯度下降反向传播方法,对初始化网络参数后的改进YOLOv3模型中的深度卷积神经网络的参数进行迭代更新;将迭代至最大设定次数后得到的网络参数作为最优的网络参数,完成训练,得到初步的改进YOLOv3模型;
使用验证集对初步的改进YOLOv3模型进行测试,根据测试结果调整网络结构,根据检测不出的图片在网上下载类似图片,标注后加入训练集,并重新训练直至测试结果达到预期为止,得到最终的训练好的改进YOLOv3模型。
3.根据权利要求2所述的基于改进YOLOv3模型的行人检测方法,其特征在于,所述获取自动驾驶场景下的历史行人图像,根据历史行人图像构建初始数据集,对初始数据集中的图像进行标注,得到行人数据集的过程包括:
通过自行拍摄和网上爬虫收集包含自动驾驶场景下的行人图像构建初始数据集;
从初始数据集中的图像中提取行人图像帧,并使用LabelImg工具对所有图像标注行人区域,生成VOC格式的行人数据集。
4.根据权利要求2所述的基于改进YOLOv3模型的行人检测方法,其特征在于,
在每一次迭代更新时使用图像增强方法对训练集进行处理,得到行人图像特征增强后的训练集;
所述数据增强方法的操作包括对行人图像执行缩放、翻转、平移、旋转、灰度填补、均值、方差标准化、颜色变换、混合图像和随机多尺度操作,得到特征增强后的行人图像。
5.根据权利要求1所述的基于改进YOLOv3模型的行人检测方法,其特征在于,所述获取自动驾驶场景下实时采集的监控场景视频,从视频中提取图像帧的过程包括:
获取自动驾驶场景下实时采集的监控场景视频,从监控场景视频中的每n帧提取一张图像,根据现场光通量、照度、亮度情况对图像进行预处理操作,得到要提取的图像帧;
所述预处理操作包括图像去噪、对比度增强、亮度和饱和度调整;n取值范围为[25,30]。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河海大学,未经河海大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110453896.9/1.html,转载请声明来源钻瓜专利网。