[发明专利]基于尺度不变性与特征融合的目标检测算法在审
申请号: | 202010856245.X | 申请日: | 2020-08-24 |
公开(公告)号: | CN112115977A | 公开(公告)日: | 2020-12-22 |
发明(设计)人: | 周轩弘;李季 | 申请(专利权)人: | 重庆大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/46;G06N3/04;G06N3/08 |
代理公司: | 重庆上义众和专利代理事务所(普通合伙) 50225 | 代理人: | 孙人鹏 |
地址: | 400044 *** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 尺度 不变性 特征 融合 目标 检测 算法 | ||
一种基于尺度不变性与特征融合的目标检测算法,采用的步骤为:步骤一:将待检测图像输入到detnet59中进行特征提取,获得多个特征图;步骤二:对获得的多个特征图进行选择融合特征的方式,获得新的具有相同通道的多个特征图;步骤三:使用多个特征图生成候选框,对候选框进行多次选择分类与回归。
技术领域
本发明涉及目标检测技术领域,具体涉及一种基于尺度不变性与特征融合的目标检测算法。
背景技术
随着深度学习技术的不断发展,目标检测方法越来越多。图像中存在大量的目标,对每一个目标进行分类与检测是比较困难的,特别是一些小目标,因此小目标的检测是目前目标检测领域中的重点区域。
目标检测是一个复杂且重要的任务,对军事,医疗,生活等方面都有着巨大的作用。已有的目标检测技术主要分为两种类型:一是基于手工标注特征的传统方法,例如Hear特征和Adaboost算法、SVM算法和DPM算法;二是基于深度学习技术的方法。在深度学习下,目标检测主要分为了以下两个任务:一个是边框的预测,标出每个物体的上下左右的位置。另一个是类别的预测,预测出每个像素属于哪个物体。而又因为步骤不同,目标检测又分为了二阶段检测和单阶段目标检测。二阶段目标检测的代表论文主要有RCNN系列,即先产生物体候选区域(Region Proposals),然后在对其进行修正。单阶段的目标检测的代表论文主要是YOLO、SSD系列,即通过网络直接预测出边框的位置。总体上来说,二阶段的目标检测的精度比单阶段的目标检测的精度更高,而单阶段目标检测精度不如二阶段的,但是在保证了一定的精度下检测速度更快。但是这俩种方法都存在一个尺度变换问题。因为这俩种方法都是基于较大的下采样因子,而产生较高的感受野来获得更多的语义信息,这是有利于大物体识别。但是,下采样必定带来空间分辨率的损害,下采样越大,分辨率越小,小物体识别也就更困难。为了解决下采样带来的尺度变换问题,常用的方法是多尺度特征融合。FPN首次使用了该方法,通过自顶向下的思想,低层的特征融合高层的特征来获得了更多的语义信息。其后PANet在FPN的基础上进行了改进,在加上了自底向上的思想,在从低层特征逐步下采样到高层特征的分辨率,并且与高层特征融合,使得高层特征也具有了低层特征的空间信息。但是这种方法也存在缺陷,不同层对不同尺度的敏感性不同,高层特征即使融合了低层特征的空间信息,但同时也带来了低层的语义信息,因此会对本身已经训练好的高层特征产生影响,使得高层特征对大物体的分类以及预测能力减弱。
发明内容
本发明针对现有技术的不足,提出一种解决现有的目标检测方法中存在的尺度变化问题,提升小目标以及大目标的检测的基于尺度不变性与特征融合的目标检测算法,具体技术方案如下:
一种基于尺度不变性与特征融合的目标检测算法,采用的步骤为:
步骤一:将待检测图像输入到detnet59中进行特征提取,获得多个特征图;
步骤二:对获得的多个特征图进行选择融合特征的方式,获得新的具有相同通道的多个特征图;
步骤三:使用多个特征图生成候选框,对候选框进行多次选择分类与回归。
作为优化:所述detnet59为改进的detnet59,所述改进的detnet59与detnet59拥有相同的第一步到第五步,分别生成1-5个特征图,从第五步开始,使用第5个特征图,分成了三个分支,生成第6-8个特征图,第6个特征图的分辨率与第5个特征图保持一样,使用膨胀卷积保持感受野不同,第7,8个特征图使用下采样降低分辨率增加语义信息,再使用膨胀卷积增加第7,8个特征图的感受野。
作为优化:所述步骤二中选择融合特征的方式具体为;
步骤2.1:将第2-8的特征图通过卷积操作变为通道256的特征图,其中第6-8的特征图就生成为P6-P8;
步骤2.2:在将7和8的特征图经过上采样后和6的特征图一起融合到特征图5中,在融合之后再对每个融合结果进行卷积生成P5;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆大学,未经重庆大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010856245.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于微服务的上线方法和上线系统
- 下一篇:一种新型的绿色缓冲防护包装结构