[发明专利]一种基于改进的RetinaNet小目标检测方法有效
申请号: | 202110344831.0 | 申请日: | 2021-03-30 |
公开(公告)号: | CN113159063B | 公开(公告)日: | 2022-11-18 |
发明(设计)人: | 任利;唐昊;贾宇明;贾海涛;许文波;毛晨;鲜维富;田浩琨 | 申请(专利权)人: | 电子科技大学 |
主分类号: | G06V10/44 | 分类号: | G06V10/44;G06V10/82;G06N3/04;G06N3/08;G06T3/40 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 611731 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 改进 retinanet 目标 检测 方法 | ||
本发明公开了一种基于改进RetinaNet的小目标检测技术。该发明在许多基于深度学习的目标检测模型都具有一定的实用性,该专利以行人与车辆检测为说明案例。行人与车辆的检测在计算机视觉的实际较为广泛,且两类目标都呈现出目标尺寸下、检测场景复杂的特点。针对检测场景复杂的问题,在RetinaNet模型结构中的FPN加入了多层融合模块,多层融合可以一定程度解决特征金字塔结构中顶层语义信息被稀释的问题;针对小目标的问题,由于多尺度检测中小目标在特征层的选择灵活性较低,较大程度上依赖金字塔底层的细节信息,利用超分辨SR技术对底层特征信息进行补偿,使底层的细节信息和纹理信息等更加丰富。基于改进后的RetinaNet算法模型能够精准识别小尺寸目标,且模型也取得较高检测精度。
技术领域
本发明涉及深度学习中的目标检测领域,针对小目标检测尤其是行人与车辆检测技术。
背景技术
随着计算机视觉技术的发展与硬件设备性能的提高,目标检测技术在生产生活运用度大幅提高,特别是行人与车辆检测是当今最为常见的检测运用场景。如图1所示,行人与车辆两类目标在实际检测场景出通常呈现出目标尺寸小、场景环境复杂的特点,传统依靠人眼对监控视频进行定位与排查效率低下,且准确度不高,易出现漏检误检等现象。此外人眼筛查无法满足实时监控与检测的要求。因此行人与车辆检测就显得十分重要。
常见的检测算法通常分为以下几类:
(1)基于人工提取特征的目标检测算法:该类算法主要包括HOG、SIFT、SURF以及DPM等;
(2)基于卷积神经网络的目标检测算法:该类算法又可细分为两类,一类为单阶段目标检测算法,包括SSD、YOLOV3、RetinaNet等;另一类则是双阶段检测算法,包括SPPNet以及RCNN系列模型。
随着深度学习的不断进步和发展,其在生产生活等领域的应用越来越广泛,尤其是目标检测技术,出现了一批性能优秀的检测框架,但对于小目标及复杂场景的检测一致是该领域的一大难题。复杂场景精测结果不理想及小目标检测精度低的根本原因在于不同尺度的特征金字塔层级中的信息没有得到高效合理地利用。本发明对常见的FPN特征金字塔结构进行优化,并对小目标检测进行特殊改进,本发明在各类检测算法中具有一定的通用性。
发明内容
为了克服上述现有技术的不足,本发明提出了一种基于改进的RetinaNet小目标检测技术。该技术引用了深度学习中性能较强的目标检测框架RetinaNet,并针对特征稀释和小目标问题进行了进一步的改进。
本发明所采用的技术方案是:
步骤1:特征提取主干网络采用Resnet-101,包括Conv1、Conv2_x、Conv3_xConv4_x、Conv5_x(简记C1,C2,C3,C4,C5)五个不同尺度的采样层,将每层最后一个残差块的输出特征图利用1×1的卷积进行通道数统一,统一后的特征图分别记为M2,M3,M4,M5;
步骤2:将M5经过3×3卷积消除融合带来的混叠效应,生成特征金字塔的最顶层特征层,记作P5,将M5经两倍上采样,与M4逐像素相加,再经过3×3卷积消除融合带来的混叠效应生成特征图,记为P4。
步骤3:该步骤为专利的核心步骤之一,将C5和C4经过1×1卷积处理后的特征层将其尺寸改变直与C3一致大小,并与C3进行通道拼接得到全新的多层特征F3,并将通道重新排列,然后利用1×1卷积减少特征通道数,并将其与经过上采样的M4逐像素相加融合,得到P3;
步骤4:将P3通过语义内容提取器进行提取,将提取到的特征信息通过接着通过亚像素卷积操作可以将内容提取器提取到的特征的分辨率提升一倍,其尺寸大小在亚像素卷积操作完成后与M2的尺寸大小一致,接着将P3与M2进行融合得到P2,通过纹理提取器进行进一步提取,并与亚像素卷积的输出结果进行融合,得到最终的P2;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110344831.0/2.html,转载请声明来源钻瓜专利网。