[发明专利]一种基于激活函数的改进YOLOv4车辆行人检测算法在审
申请号: | 202210007093.5 | 申请日: | 2022-01-05 |
公开(公告)号: | CN114694104A | 公开(公告)日: | 2022-07-01 |
发明(设计)人: | 王兰美;魏兵;王桂宝;廖桂生;贾建科;孙长征 | 申请(专利权)人: | 西安电子科技大学;陕西理工大学 |
主分类号: | G06V20/54 | 分类号: | G06V20/54;G06V20/56;G06V40/10;G06V10/44;G06V10/764;G06V10/82;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 710071 陕*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 激活 函数 改进 yolov4 车辆 行人 检测 算法 | ||
本发明提出了一种基于激活函数的改进YOLOv4车辆行人检测算法;构造了零点处梯度并不突变的FMish激活函数,保证信息流动,不会出现“梯度消失”;本发明在Dense‑YOLOv4与Dense‑YOLOv4‑Small网络结构的基础上,将全部的激活函数替换为FMish激活函数;本发明将KITTI道路目标数据集中的“Misc”和“Dontcare”剔除得到KITTI‑7classes道路目标数据集,在KITTI‑7classes数据集上对三个模型进行训练,并比较了检测速度和检测性能;基于FMish激活函数的网络模型不仅避免饱和问题,而且避免了“梯度爆炸”问题,保证训练过程的稳定性,提升检测效果。
技术领域
该发明属于图像识别领域,一种基于激活函数的改进YOLOv4车辆行人检测算法,该算法在通用标准数据集上表现出很好的检测性能。
背景技术
随着计算机技术的不断发展及算力的不断提升,计算机视觉与其中的目标检测成为了近年来热门方向。利用目标检测可以对特定物体进行识别与定位,在驾驶辅助系统、军事预警系统等有广泛的发展前景。目标检测技术包括传统目标检测技术及基于深度学习的目标检测技术,而后者由于在性能与复杂度方面优于前者,已成为当前目标检测领域的主流算法。为了更高效管理交通道路,维持社会稳定,需要对道路上的行人车辆等目标进行检测。车辆行人的检测任务在无人驾驶领域中占据重要地位。进行智能车辆行人识别,可以辅助交警进行有效的管理和交通流量控制,并且可以及时预测接下来的交通状况,预防交通拥堵。
本发明基于YOLOv4网络和KITTI道路目标数据集,构建了更高性能的车辆行人检测算法。以YOLOv4为基础网络,借鉴DenseNet的思想,设计了Dense- SPP模块和Dense-特征融合模块,称为Dense-YOLOv4,可以有效地对高层特征进行多尺度池化以增加感受野以及更加充分的融合网络高层的特征,同时还能减少网络的计算量。
本发明所用的数据集是KITTI道路目标数据集,为了使模型能够更加轻量化的同时还能基本保持检测精度,设计了Dense-YOLOv4-Small网络模型,同时构造了FMish激活函数,其在零点处梯度并不突变,而是为非常小的负梯度,从而保证信息流动。在KITTI道路目标数据集上对YOLOv4、Dense-FMish- YOLOv4、Dense-FMish-YOLOv4-Small三个模型进行训练,并对比三种模型在检测速度,mAP和Recall指标上的性能。FMish激活函数不仅能避免饱和问题,而且函数较为平缓,避免“梯度爆炸”的问题,可以保证训练过程的稳定性,提升检测效果。
发明内容
针对以上问题,本发明的目的是提供一种针对YOLOv4网络结构的基于激活函数的改进YOLOv4车辆行人检测算法。
为了实现上述目的,本发明采取如下的技术解决方案:
一种基于激活函数的改进YOLOv4车辆行人检测算法,在Dense-YOLOv4与 Dense-YOLOv4-Small网络结构的基础上,构造了FMish激活函数,其在零点处梯度并不突变,而是为非常小的负梯度,将全部的激活函数替换为FMish激活函数,称为Dense-FMish-YOLOv4与Dense-FMish-YOLOv4-Small算法,FMish 激活函数不仅能避免饱和问题,而且函数较为平缓,避免“梯度爆炸”的问题,可以保证训练过程的稳定性,提升检测效果。
所述车辆行人检测算法包括以下步骤:
步骤一、下载当前目标检测领域通用数据集KITTI道路目标数据集,剔除原始KITTI数据集中的“Misc”和“Dontcare”两类数据,创建KITTI-7Classes道路目标数据集,使用该数据集可保证算法检测效果与该领域公开的通用数据集保持一致,构建了本发明使用的道路目标数据集;将测试集、验证集与训练集按照 6:2:2的比例划分;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学;陕西理工大学,未经西安电子科技大学;陕西理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210007093.5/2.html,转载请声明来源钻瓜专利网。