[发明专利]一种基于双向特征融合和更平衡L1损失的单发多框检测器优化方法有效

专利信息
申请号: 201911121603.6 申请日: 2019-11-15
公开(公告)号: CN111222534B 公开(公告)日: 2022-10-11
发明(设计)人: 赵辉;李志伟;方禄发 申请(专利权)人: 重庆邮电大学
主分类号: G06V10/764 分类号: G06V10/764;G06V10/774;G06V10/82;G06N3/04;G06N3/08
代理公司: 北京同恒源知识产权代理有限公司 11275 代理人: 赵荣之
地址: 400065 *** 国省代码: 重庆;50
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 双向 特征 融合 平衡 l1 损失 单发 检测器 优化 方法
【说明书】:

发明涉及一种基于双向特征融合和更平衡L1损失的单发多框检测器优化方法,属于计算机视觉领域。A1:对训练集图像进行预处理;A2:构建传统SSD模型;A3:基于双向特征融合和更平衡L1损失函数修改传统SSD算法模型并构建BFSSD模型;A4:对BFSSD算法模型进行训练;A5:对BFSSD算法模型的性能进行测试。本发明解决了传统SSD算法在训练过程中存在的正负样本和多任务不平衡问题,对于小目标检测具有良好的鲁棒性。

技术领域

本发明属于计算机视觉领域,涉及一种基于双向特征融合和更平衡L1损失的单发多框检测器优化算法。

背景技术

目标检测是计算机视觉的核心任务之一,广泛应用于智能监控、自动驾驶等领域。近年来,基于深卷积神经网络(Deep Convolutional Neural Networkd,DCNN)的各种目标检测方法取得了显著的性能,提高了目标检测的精度和速度。基于深度卷积神经网络的目标检测方法大致可分为两类:

(1)两阶段检测框架,首先产生一系列目标候选区域,然后通过深度神经网络提取目标候选区域的特征,并用这些特征进行分类,以及目标真实边界框回归。两阶段检测器主要包括:具有开创性的RCNN,在R-CNN体系结构中引入传统的空间金字塔池的SPPNet,RCNN的改进版本Fast RCNN和Faster RCNN,以及一些从不同角度引入许多新方法来提高准确度和速度的框架,例如,FPN、Cascade RCNN和Mask RCNN。

(2)一阶段检测框架,不生成目标候选区域而直接基于回归的目标检测与识别算法,它直接产生物体类别的概率和位置坐标。YOLO(You Only Look Once)和SSD(SingleShot Multibox Detector)推广了一阶段检测器,它们比以往的两阶段检测器简单、快速,可以在GPU上实现实时处理,但精度相对落后。

SSD具有较高的检测精度和速度,对尺度变化具有较好的鲁棒性。SSD充分利用不同输出层的特征进行目标检测,然后合并不同层的检测结果,最后采用非极大值抑制(NMS)方法抑制冗余检测框。传统的SSD算法虽然在速度和精度上都有很好的性能,但仍存在一些不足需要改进。首先,传统SSD算法中用于目标检测的特征金字塔中的不同层是独立的,没有考虑不同特征层之间的关系,忽略了一些上下文信息。然而,小目标通常严重依赖上下文信息,因此SSD在小目标检测方面存在局限性。为了解决这个问题,DSSD用Resnet-101代替SSD的基础骨干网,并用反褶积层来聚合上下文,增强浅层特征的高层语义。RSSD利用池化和反褶积实现了彩虹连接(rainbow concatenation),融合不同层次的特征,增加特征层的通道数等方式来提高小目标检测的精度,然而由于网络结构的复杂度过高,检测速度被大大降低。此外,研究人员发现,基础骨干网络中的深层特征具有更多的语义,而浅层特征具有更多的内容描述,因此最近FPN和PANet中通过横向连接的特征集成推动了目标检测的发展。这些方法启发我们,低层信息和高层信息在目标检测中是互补的,如何利用它们集成金字塔表示的方法决定了检测性能。其次,目标检测需要完成分类和定位两项任务,因此它的训练目标也包含了这两项任务。如果它们没有得到适当的平衡,一个目标可能会受到损害,从而导致总体表现欠佳。训练过程中涉及的样本情况也是如此,如果正负样本的梯度贡献不能很好地平衡,负样本(easy samples)产生的小梯度可能淹没在正样本(hard samples)产生的大梯度中,从而限制了进一步的细化,这些不平衡会导致训练效率低下和模型退化。因此,减少目标检测训练过程中的不平衡是实现最优训练和充分挖掘模型结构潜力的关键。SSD精度低的原因之一是极不平衡的正负样本采样率。OHEM只保留损失最大的样本,而完全忽略easy samples。

发明内容

有鉴于此,本发明的目的在于提供一种基于双向特征融合和更平衡L1损失的单发多框检测器优化方法,针对传统SSD算法由于独立使用多尺度特征层而没有考虑不同特征层之间的关系,进而忽略了一些上下文信息,导致对于小目标检测不够鲁棒的问题,以及传统SSD算法在训练过程中存在的正负样本和多任务不平衡问题。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆邮电大学,未经重庆邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201911121603.6/2.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top