[发明专利]一种基于激活函数改进的YOLOv3算法在审
申请号: | 202010880785.1 | 申请日: | 2020-08-28 |
公开(公告)号: | CN112364974A | 公开(公告)日: | 2021-02-12 |
发明(设计)人: | 王兰美;朱衍波;褚安亮;廖桂生;王桂宝;孙长征;贾建科 | 申请(专利权)人: | 西安电子科技大学;陕西理工大学 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08;G06K9/62 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 710071 陕*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 激活 函数 改进 yolov3 算法 | ||
本发明提出了一种基于激活函数改进的YOLOv3算法,提高了检测平均准确率。激活函数将非线性特性的激活函数引入网络中,从而保证网络的学习能力。首先准备当前目标检测领域通用PASCAL VOC数据集;其次重建现有算法YOLOv3网络模型,训练过程中采用Adam算法作为优化算法,检测其性能;然后将改进版激活函数嵌入YOLOv3算法模型中进行训练并作性能评价;最后对比经典的YOLOv3算法,分析测试结果。本发明提出的基于激活函数改进的YOLOv3算法,相比经典的YOLOv3算法,在通用PASCAL VOC数据集上,mAP指标提升了接近1%,另外该模块也没有引入更多的计算量,与原模型相比,实时性没有受到影响。该模块仍然能够嵌入其他经典算法模型中做对比测试,更具适用性,且具有更高的鲁棒性。
技术领域
该发明属于图像识别领域,尤其涉及一种基于改进了激活函数的YOLOv3 目标检测算法,该算法在通用标准数据集PASCAL VOC上表现出很好的检测性能。
背景技术
目标检测主要包括传统目标检测技术及基于深度学习的目标检测技术,近年来,随着科技的发展及智能化的普及,传统的目标检测技术远远达不到人们的需求,基于深度学习的目标检测技术应运而生且发展迅速,成为当前目标检测领域的主流算法。
基于深度学习的目标检测技术大体可分为一阶段和二阶段两类方法:二阶段方法主要是指基于候选区域的算法,如R-CNN、Fast-R-CNN、Faster-R- CNN,该类算法首先在图片上生成若干个候选区域,然后,通过卷积神经网络在候选区域上进行候选框分类和回归。该类方法精度最高,但检测速度慢,无法满足实时要求;一阶段方法使用一个卷积神经网络直接预测不同目标的类别与位置,属于端到端的方法,主要有SSD、YOLO系列。
所谓激活函数(Activation Function),就是在人工神经网络的神经元上运行的函数,负责将神经元的输入映射到输出端。常用的激活函数有:Sigmoid函数; Tanh函数;ReLU函数。本文提出一种改进激活函数,并将其嵌入到现行经典算法YOLOv3中检测其性能,与原模型相比,本文改进的模型在精度上提升了近 1%,另外该模块也没有引入更多的计算量,与原模型相比,实时性没有受到影响。该模块仍然能够嵌入其他经典算法模型中做对比测试,更具适用性。
发明内容
本发明方法提出了一种基于激活函数的改进的YOLOv3算法,通过嵌入改进的激活函数,使YOLOv3算法的检测性能有了部分提升。
步骤一:下载当前目标检测领域通用数据集PASCAL VOC数据集,保证与该领域通用数据集保持一致,以达到比对效果,检测本发明方法性能。下载地址为:https://pjreddie.com/projects/pascal-voc-dataset-mirror/。
PASCAL VOC数据集提供了20个对象类别。本发明用到的数据集中图片为标注了目标的类别信息pi及该目标所在的中心位置坐标(x,y)及目标的宽度 w和高度h,用矩形框可视化。
步骤二:以改进的激活函数为基础,重建YOLOv3网络结构。
首先,对网络的初始权重进行随机化,使其服从高斯正态分布,然后输入一张RGB图片,这张图片可以表示为a×a×3的矩阵形式,其中a为图片的宽度和高度。
随后,输入矩阵经由下面构建的网络结构,由52个卷积层组成,分为三个阶段,即三个不同尺度的输出。具体如下,其中“×”代表乘积:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学;陕西理工大学,未经西安电子科技大学;陕西理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010880785.1/2.html,转载请声明来源钻瓜专利网。