[发明专利]一种基于双向特征融合和更平衡L1损失的单发多框检测器优化方法有效
申请号: | 201911121603.6 | 申请日: | 2019-11-15 |
公开(公告)号: | CN111222534B | 公开(公告)日: | 2022-10-11 |
发明(设计)人: | 赵辉;李志伟;方禄发 | 申请(专利权)人: | 重庆邮电大学 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/774;G06V10/82;G06N3/04;G06N3/08 |
代理公司: | 北京同恒源知识产权代理有限公司 11275 | 代理人: | 赵荣之 |
地址: | 400065 *** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 双向 特征 融合 平衡 l1 损失 单发 检测器 优化 方法 | ||
本发明涉及一种基于双向特征融合和更平衡L1损失的单发多框检测器优化方法,属于计算机视觉领域。A1:对训练集图像进行预处理;A2:构建传统SSD模型;A3:基于双向特征融合和更平衡L1损失函数修改传统SSD算法模型并构建BFSSD模型;A4:对BFSSD算法模型进行训练;A5:对BFSSD算法模型的性能进行测试。本发明解决了传统SSD算法在训练过程中存在的正负样本和多任务不平衡问题,对于小目标检测具有良好的鲁棒性。
技术领域
本发明属于计算机视觉领域,涉及一种基于双向特征融合和更平衡L1损失的单发多框检测器优化算法。
背景技术
目标检测是计算机视觉的核心任务之一,广泛应用于智能监控、自动驾驶等领域。近年来,基于深卷积神经网络(Deep Convolutional Neural Networkd,DCNN)的各种目标检测方法取得了显著的性能,提高了目标检测的精度和速度。基于深度卷积神经网络的目标检测方法大致可分为两类:
(1)两阶段检测框架,首先产生一系列目标候选区域,然后通过深度神经网络提取目标候选区域的特征,并用这些特征进行分类,以及目标真实边界框回归。两阶段检测器主要包括:具有开创性的RCNN,在R-CNN体系结构中引入传统的空间金字塔池的SPPNet,RCNN的改进版本Fast RCNN和Faster RCNN,以及一些从不同角度引入许多新方法来提高准确度和速度的框架,例如,FPN、Cascade RCNN和Mask RCNN。
(2)一阶段检测框架,不生成目标候选区域而直接基于回归的目标检测与识别算法,它直接产生物体类别的概率和位置坐标。YOLO(You Only Look Once)和SSD(SingleShot Multibox Detector)推广了一阶段检测器,它们比以往的两阶段检测器简单、快速,可以在GPU上实现实时处理,但精度相对落后。
SSD具有较高的检测精度和速度,对尺度变化具有较好的鲁棒性。SSD充分利用不同输出层的特征进行目标检测,然后合并不同层的检测结果,最后采用非极大值抑制(NMS)方法抑制冗余检测框。传统的SSD算法虽然在速度和精度上都有很好的性能,但仍存在一些不足需要改进。首先,传统SSD算法中用于目标检测的特征金字塔中的不同层是独立的,没有考虑不同特征层之间的关系,忽略了一些上下文信息。然而,小目标通常严重依赖上下文信息,因此SSD在小目标检测方面存在局限性。为了解决这个问题,DSSD用Resnet-101代替SSD的基础骨干网,并用反褶积层来聚合上下文,增强浅层特征的高层语义。RSSD利用池化和反褶积实现了彩虹连接(rainbow concatenation),融合不同层次的特征,增加特征层的通道数等方式来提高小目标检测的精度,然而由于网络结构的复杂度过高,检测速度被大大降低。此外,研究人员发现,基础骨干网络中的深层特征具有更多的语义,而浅层特征具有更多的内容描述,因此最近FPN和PANet中通过横向连接的特征集成推动了目标检测的发展。这些方法启发我们,低层信息和高层信息在目标检测中是互补的,如何利用它们集成金字塔表示的方法决定了检测性能。其次,目标检测需要完成分类和定位两项任务,因此它的训练目标也包含了这两项任务。如果它们没有得到适当的平衡,一个目标可能会受到损害,从而导致总体表现欠佳。训练过程中涉及的样本情况也是如此,如果正负样本的梯度贡献不能很好地平衡,负样本(easy samples)产生的小梯度可能淹没在正样本(hard samples)产生的大梯度中,从而限制了进一步的细化,这些不平衡会导致训练效率低下和模型退化。因此,减少目标检测训练过程中的不平衡是实现最优训练和充分挖掘模型结构潜力的关键。SSD精度低的原因之一是极不平衡的正负样本采样率。OHEM只保留损失最大的样本,而完全忽略easy samples。
发明内容
有鉴于此,本发明的目的在于提供一种基于双向特征融合和更平衡L1损失的单发多框检测器优化方法,针对传统SSD算法由于独立使用多尺度特征层而没有考虑不同特征层之间的关系,进而忽略了一些上下文信息,导致对于小目标检测不够鲁棒的问题,以及传统SSD算法在训练过程中存在的正负样本和多任务不平衡问题。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆邮电大学,未经重庆邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911121603.6/2.html,转载请声明来源钻瓜专利网。