[发明专利]一种基于反馈机制的目标检测方法及系统有效
申请号: | 202010507657.2 | 申请日: | 2020-06-05 |
公开(公告)号: | CN111739062B | 公开(公告)日: | 2021-05-25 |
发明(设计)人: | 张宝昌;吕金虎;毛明远;田雨鑫 | 申请(专利权)人: | 北京航空航天大学 |
主分类号: | G06T7/246 | 分类号: | G06T7/246;G06K9/32;G06N3/04;G06N3/08 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 杨云云 |
地址: | 100191*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 反馈 机制 目标 检测 方法 系统 | ||
本发明实施例提供一种基于反馈机制的目标检测方法及系统。该方法包括:获取待检测目标;将所述待检测目标输入至改进的IFF目标检测器,得到目标检测结果;其中所述改进的IFF目标检测器是基于目标检测器,增加IFF模块所获得的。本发明实施例通过在现有的目标检测器中增加IFF反馈模块,将上一次的预测结果作为参考信息反馈给特征图,可以起到滤波的作用,特征图的激活区域将会更加集中于目标区域,还通过将类别信息和位置信息融合,有利于网络捕捉到两者之间的耦合关系。
技术领域
本发明涉及计算机视觉技术领域,尤其涉及一种基于反馈机制的目标检测方法及系统。
背景技术
目标检测是计算机视觉中一个重要的分支,它由两部分任务组成,即定位和分类。因此,目标检测需要用矩形框定位出输入图像或视频的目标位置以及目标类别。而随着计算机技术的发展和计算机视觉原理的广泛应用,利用计算机图像处理技术对目标进行实时跟踪研究越来越热门,对目标进行动态实时跟踪定位在智能化交通系统、智能监控系统、军事目标检测及医学导航手术中手术器械定位等方面具有广泛的应用价值。
正由于目标检测可以被分解为定位和分类两个任务,因此很自然想到可以分别解决这两个问题,按照这种思路实现的检测器属于多阶段方法。多阶段分类器的代表工作包括R-CNN,Fast-RCNN,Faster-RCNN以及Cascade-rcnn等。R-CNN采用selective search算法提取出有可能含有目标的候选区域,然后将候选区域输入卷积神经网络(CNN),提取特征,再用支持向量机(SVM)进行分类,最后加入一个回归器对候选区域进行边框修正,得到最终的结果。但是,由于selective search算法运行时间长,且三个模块(CNN特征提取、SVM分类和边框修正)是分别训练的,并且在训练的时候,对于存储空间的消耗很大,使得R-CNN消耗的内存和计算时间都非常巨大。为此,Fast-RCNN将整幅图作为CNN的输入,而不再是输入候选区域,这样充分利用了CNN权重共享的特点,大大减少了计算时间和内存消耗。此外,Fast-RCNN使用一个RoI Pooling Layer在全图特征上摘取每一个RoI对应的特征。对于每个RoI而言,需要从共享卷积层获取的特征图上提取对应的特征,并且送入全连接层进行分类。因此,RoI Pooling主要做了两件事,第一件是为每个RoI选取对应的特征,第二件事是为了满足全连接层的输入需求,将每个RoI对应的特征的维度转化成某个定值。但是,Fast-RCNN仍然保留了selective search的候选区域生成算法,因此检测速度仍然不理想。因此,Faster-RCNN舍弃了selective search方法,而是直接通过一个Region Proposal Network(RPN)生成待检测区域,这么做,在生成RoI区域的时候,消耗的时间减少了200倍。之后,在Faster-RCNN的基础上,有许多新的工作出现,比如FPN将CNN不同层的特征图进行融合,以此来适应多种尺度的目标,取得了显著的成果;Cascade r-cnn探究了训练过程中生成的检测框和标签的重合度(IOU)的阈值设定和检测结果的关系,提出了一种级联的结构,进一步提升了检测的精度。
虽然多阶段方法取得了许多重要的进展,但实时性较差一直是其一个弊端,因为是多阶段的模型,在运行时耗时较长,因此很难用在对实时性要求较高的场景中,比如自动驾驶。所以,单阶段的目标检测算法应运而生,其中比较重要的工作包括SSD,YOLO和Retinanet等,这些方法都是端到端的方法,只用一个CNN,输入是原始图像,输出直接为目标类别和位置。其中,在定位方面,它们都采用了anchor的概念,即预先设置一些边框形状,在此基础上进行修正,得到精确的目标位置。其中,YOLO的实时性最好,因为它只用物体所在像素点的anchor与之进行匹配,但精度稍低于SSD和Retinanet。Retinanet的亮点在于提出了Focal Loss这一重要概念,比较好地解决了正负样本不平衡的问题。此外,也有一些不使用anchor的单阶段的检测器,比如CornerNet和CenterNet,其精度也与基于anchor的检测器基本持平。
发明内容
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学,未经北京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010507657.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:智能自动装载系统及方法
- 下一篇:一种近红外透过滤光片及其制备方法