[发明专利]基于Faster RCNN改进的少样本目标检测方法在审
申请号: | 202210311386.2 | 申请日: | 2022-03-28 |
公开(公告)号: | CN114663707A | 公开(公告)日: | 2022-06-24 |
发明(设计)人: | 江彧;杜芸彦;毛耀;李鸿;杨锦辉;刘超;彭锦锦 | 申请(专利权)人: | 中国科学院光电技术研究所 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/42;G06V10/44;G06V10/74;G06V10/82;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京科迪生专利代理有限责任公司 11251 | 代理人: | 邓治平 |
地址: | 610209 *** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 faster rcnn 改进 样本 目标 检测 方法 | ||
本发明提供一种基于FasterRCNN改进的少样本目标检测方法。本发明在传统目标检测框架FasterRCNN的基础上,结合CBAM注意力模块、全局‑局部关系检测器以及基于余弦Softmax损失的分类器对FasterRCNN进行了深度优化和改进,使其有利于少样本目标检测。本发明将CBAM注意力模块与FasterRCNN中的RPN网络相结合形成了基于注意力机制的CBAM‑Attention‑RPN网络,有助于生成特定类别的候选框,提高后续网络的精度。本发明提出了全局‑局部关系检测器,利用全局关系和局部关系两种关系对支持图像特征和查询图像特征进行特征匹配,有助于得到与目标类别更相关的候选框。本发明提出了基于余弦Softmax损失的分类器作为分类分支,有助于降低类内方差,提高新类的检测精度。
技术领域
本发明涉及深度学习目标检测和少样本学习领域,具体涉及一种基于FasterRCNN改进的少样本目标检测方法。
背景技术
目标检测作为一个重要的计算机视觉任务,旨在找出图像中所感兴趣的目标,确定它们的位置和所属类别,是许多其他计算机视觉任务的基础。近年来,随着强大的计算设备、大规模数据集以及先进的模型和算法的出现,基于深度学习技术的目标检测得到了快速发展,并逐步取代传统的检测方法。现在,目标检测已广泛应用于许多实际应用中,例如自动驾驶、机器人视觉、视频监控等。虽然现在有很多成熟的目标检测算法都得到了实际应用,但是其弊端也开始浮现,其中一个较大的问题就是较大多数成熟算法的应用都需要借助于大规模的标注数据,而在绝大多数的实际应用场景中,收集满足要求的标注数据是一件十分耗费财力和物力的工作,这不仅导致了应用场景单一、覆盖任务单一等问题,也极大限制了目标检测方法的应用与推广,因此如何利用较少的标注数据学习具有一定泛化能力的模型成为了迫切研究的问题。而少样本学习方法不依赖于大规模的训练样本,从而避免了在某些特定应用中数据准备的高昂成本,其次少样本学习方法可以实现一个新兴任务的低成本和快速的模型部署,而这个任务只有几个暂时可用的样本,这有利于阐明任务早期的潜在规律。基于此,将少样本学习与目标检测进行结合是十分有必要的,少样本学习可以有效地解决目标检测中数据量不足的问题,进一步推动目标检测的发展,扩大其实际应用的范围,因此,基于少样本学习的目标检测算法是具有一定研究意义的。
本发明就是将少样本学习方法和基于深度学习的目标检测算法Faster RCNN相结合,构成基于少样本学习的目标检测方法,使其能够仅使用少量的目标标注样本实现对目标的目标检测。
发明内容
本发明要解决的技术问题是:提供了一种基于Faster RCNN改进的少样本目标检测方法,以解决在目标类别样本量不足的情况下,对目标对象进行检测的问题,实验证明本发明提出的方法能够有效提高少样本情况下对目标类别的检测精度。
本发明采用的技术方案如下:基于Faster RCNN改进的少样本目标检测方法,包括如下步骤:
步骤1:将图像划分为支持集图像和查询集图像,其中支持集图像为少量几张包含目标样本的图像,其中样本已被标注,查询集包含未标注的样本,但其和支持集类别空间一致。
步骤2:将支持图像和查询图像输入权重共享的骨干网络进行特征提取,支持图像提取的特征定义为支持特征图,查询图像提取的特征定义为查询特征图。
步骤3:支持特征图和查询特征图分别通过CBAM注意力模块生成对应的注意力特征图后,将支持集注意力特征进行均值池化和深度卷积,将查询集注意力特征进行深度卷积,再将得到的两个结果进行深度互相关生成最终的注意力特征图,然后将注意力特征图输入RPN网络生成查询候选框。
步骤4:将支持集注意力特征图和其真实的标签框经过ROI Pooling操作得到支持目标特征图,再将查询集注意特征图和查询候选框经过ROI Pooling操作得到查询候选框特征图,再将支持目标特征图和查询候选框特征图送入全局-局部关系检测器进行特征匹配计算,以此得到相似度高的查询候选框特征图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院光电技术研究所,未经中国科学院光电技术研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210311386.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:界面显示方法、装置、存储介质以及终端
- 下一篇:衣物处理设备