[发明专利]一种基于轻量级卷积神经网络的实时多尺度目标检测方法有效
申请号: | 202010619209.1 | 申请日: | 2020-07-01 |
公开(公告)号: | CN111967305B | 公开(公告)日: | 2022-03-18 |
发明(设计)人: | 林耀荣;李环;张国雄 | 申请(专利权)人: | 华南理工大学;广州市长优电子有限公司 |
主分类号: | G06V20/56 | 分类号: | G06V20/56;G06V20/40;G06K9/62;G06N3/04;G06N3/08;G06V10/762;G06V10/80 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 詹丽红 |
地址: | 510640 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 轻量级 卷积 神经网络 实时 尺度 目标 检测 方法 | ||
本发明公开了一种基于轻量级卷积神经网络的实时多尺度目标检测方法,该检测方法过程如下:采用聚类算法对训练数据集样本目标的高宽比和面积尺度系数进行聚类,聚类中心用于优化锚点框设置;利用轻量级卷积神经网络作为RetinaNet框架的骨干网络,降低模型复杂度;同时利用残差模块对多尺度特征图进行增强,对部分增强多尺度特征图进行自适应跨层特征融合,最后利用生成的融合特征金字塔代替特征金字塔,提高模型对中小目标的检测精度。本发明公开的轻量级多尺度目标检测方法,可以在保证一定准确率的情况下,减少模型的参数量,降低模型的运算复杂度,提高模型的检测效率。
技术领域
本发明主要涉及基于深度学习的目标检测技术领域,具体涉及一种基于轻量级卷积神经网络的实时多尺度目标检测方法。
背景技术
识别不同大小的物体是计算机视觉中的一个难点。目标尺度变化范围很大的目标检测是非常具有挑战性的问题。自动驾驶场景中的车辆行人检测是典型的多尺度目标检测问题。基于路况拍摄的视频或者图像中,车辆和行人的尺度分布范围很广,且中小尺度目标占比很大。通用的目标检测算法对中小尺度的车辆和行人目标检测精度较低。特征金字塔网络FPN提供多层融合特征,是实现多尺度目标检测的一种有效方法。RetinaNet是基于FPN特征实现的一种单阶段目标检测算法,在检测速度方面具有单阶段算法的优势,性能接近双阶段目标检测算法。使用轻量级卷积神经网络作为RetinaNet的骨干网络,并对多层融合特征和预测网络进行优化,可以在保证一定准确率的情况下,减少模型的参数量,降低模型的运算复杂度。
发明内容
有鉴于此,本发明提供一种基于轻量级卷积神经网络的实时多尺度目标检测方法,可以在保证检测准确率的前提下,降低基于卷积神经网络的多尺度目标检测方法中计算复杂度高的问题。
为了解决上述问题,本发明采用的技术方案为:
一种基于轻量级卷积神经网络的实时多尺度目标检测方法,所述的检测方法包括下列步骤:
S1、利用K-Means聚类算法对训练数据集样本所有目标的高宽比进行聚类,将聚类中心作为锚点框的高宽比;然后利用K-Means聚类算法分层聚类每层特征图的面积尺度系数,将聚类中心作为对应层锚点框的尺度系数;
S2、基于RetinaNet框架,使用轻量级卷积神经网络作为骨干网络提取图像特征,输出图像的多尺度特征图C3、C4和C5,对应原始输入图像的下采样比例分别为8、16和32;
S3、利用下采样模块对输出的多尺度特征图C5进行下采样,得到多尺度特征图C6,删除原始RetinaNet框架中检测目标占比最低的最大尺度特征图C7;其中,所述的下采样模块由步长为1的1×1卷积Conv层、整流线性单元ReLU层、步长为2的3×3卷积Conv层和整流线性单元ReLU层依次级联组成,每个卷积Conv层后均级联批归一化BN层;
S4、利用残差模块Res Block对多尺度特征图C3、C4、C5和C6分别进行处理,得到增强的多尺度特征图F3、F4、F5和F6;
所述的残差模块Res Block的一支路由1×1卷积Conv层、整流线性单元ReLU层、3×3卷积Conv层、整流线性单元ReLU层、1×1卷积Conv层和整流线性单元ReLU层依次级联组成,步长均为1,另一并行支路由一个1×1卷积Conv层组成,每个卷积Conv层后均级联批归一化BN层,两支路输出维度相同,采用逐元素相加的方法将两支路输出相加,经过整流线性单元ReLU层输出;利用该残差模块统一不同尺度的增强的多尺度特征图的通道数;
S5、对增强的多尺度特征图F6进行上采样,与增强的多尺度特征图F5进行融合得到融合特征图F5’;对融合特征图F5’与增强的多尺度特征图F3、F4进行自适应跨层特征融合,得到跨层融合特征图P3、P4和P5,P3、P4、P5和F6构成多尺度的融合特征金字塔,替代原始RetinaNet框架中的特征金字塔;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学;广州市长优电子有限公司,未经华南理工大学;广州市长优电子有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010619209.1/2.html,转载请声明来源钻瓜专利网。