[发明专利]一种融合轻量级注意力模型的目标检测方法有效
申请号: | 202110344079.X | 申请日: | 2021-03-31 |
公开(公告)号: | CN112733821B | 公开(公告)日: | 2021-07-02 |
发明(设计)人: | 黄进;付国栋;杨涛;郑思宇 | 申请(专利权)人: | 成都西交智汇大数据科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 成都点睛专利代理事务所(普通合伙) 51232 | 代理人: | 葛启函 |
地址: | 610000 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 融合 轻量级 注意力 模型 目标 检测 方法 | ||
本发明属于计算机视觉中的目标检测技术领域,涉及一种融合轻量级注意力模型的目标检测方法。本发明针对目标检测中的两个问题提出了相应的解决办法,其一是针对注意力模型参数量大的问题提出通过一维卷积和空洞卷积来分别聚合通道和空间上下文特征,显著减少了模型的参数量。其二是在YOLOv4中选择合适的位置注入该轻量级注意力模型,显著提高YOLOv4的性能。
技术领域
本发明属于计算机视觉技术领域,具体的说是涉及一种融合轻量级注意力模型的目标检测方法。
背景技术
目标检测是计算机视觉和数字图像处理的一个热门方向,该技术亦在分析识别图像中物体的类别和位置。这项技术被广泛应用于机器人导航、智能视频监控、自动驾驶等许多重要领域。目前,主流的目标检测技术以深度学习为主,以YOLOv4算法目标检测为例,网络结构如图2所示,其步骤可以简要概括为:通过主干网络CSPDarknet53提取图像特征;用SPP和PANet将不同层级的特征进行融合;对融合后的特征进行编码预测。然而,由于现实场景中存在诸多复杂的因素,例如天气、角度、光照、目标物体形变以及姿态变化等,目标检测算法研究仍面临诸多挑战,现有的检测方法仍存在一些难点问题有待克服优化,其检测性能亟待改善。考虑到人类的视觉注意机制,能够决定需要关注输入的哪部分并分配有限的信息处理资源给重要的部分,对此,为解决目标特征信息利用不充分、分类置信度和定位精度间缺乏一致性的问题,使网络合理分配有限的计算资源并充分利用网络所提取的图像特征信息,让网络能够关注应该关注的图像区域,考虑将注意力模型融合进入目标检测网络。目前主流的注意力模型通常含有大量的参数,如果将注意力模型直接融合进入目标检测网络中,会显著降低网络的推理性能,这与目标检测应用场景的广泛依赖实时性相悖。因此,需要一种轻量级的注意力模型来提高目标检测的性能。
通过上述分析,现有技术存在的问题及缺陷为:
(1)YOLOv4算法对特征信息的利用不充分,没有考虑特征间的关联性。这一点造成目标检测方法对图像理解的不完整。以图2为例,图2展示了YOLOv4网络的整体结构,在特征融合部分使用SPP融合不同感受野大小的特征图,使用PANet聚合不同层级的特征图,在聚合过程中直接对不同层级的特征进行采样相加,未考虑特征图中通道特征、空间特征的相关性。
(2)现有的注意力模型含有大量参数,融合进入目标检测网络中会增加网络的复杂度,不满足目标检测的实时性需求。以图3为例,图3展示了CBAM注意力模型的通道注意力和空间注意力结构,在生成通道注意力时,使用含两层全连接层的共享全连接网络对通道特征进行聚合,共享全连接网络的参数量直接与输入特征图通道数的平方成正相关;在生成空间注意力时,使用卷积核为7×7的大卷积来聚合空间上下文信息,虽然提高了空间注意力采样点的感受野,聚合了更加广泛的信息,但同时也增加了模块的参数量。如果在目标检测网络中广泛应用该注意力模型,会极大增加网络的复杂度,增加网络推理时间。
解决以上问题及缺陷的难度为:现有技术缺乏对注意力机制如何有效融合进入目标检测网络的研究与讨论,缺少应对该问题的有效方法与评估。对于注意力机制而言,现有的注意力机制虽然存在参数量较大的缺陷,但已经形成了一套相对固定的流程。要弥补现有注意力机制的不足,需要对模型结构进行创新地设计。
解决以上问题及缺陷的意义为:上述两个问题,着眼于目标检测领域的模型复杂度与检测效果的讨论。这两个问题的解决,会使得模型在保证复杂度不大量增长的基础下,有效提升检测效果。
发明内容
本发明针对上述问题,提出一种融合轻量级注意力模型的YOLOv4目标检测方法。
本发明的技术方案是:
一种融合轻量级注意力模型的目标检测方法,其特征在于,包括以下步骤:
S1、利用现有图像制作训练数据集;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都西交智汇大数据科技有限公司,未经成都西交智汇大数据科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110344079.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种热塑性树脂单向带预浸机
- 下一篇:球窝式定位器双向自锁杆