[发明专利]用于小尺度目标检测的深度双向特征金字塔增强网络有效
申请号: | 201811219005.8 | 申请日: | 2018-10-19 |
公开(公告)号: | CN109472298B | 公开(公告)日: | 2021-06-01 |
发明(设计)人: | 庞彦伟;朱海龙 | 申请(专利权)人: | 天津大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 天津市北洋有限责任专利代理事务所 12201 | 代理人: | 程毓英 |
地址: | 300072*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 尺度 目标 检测 深度 双向 特征 金字塔 增强 网络 | ||
1.一种基于深度双向特征金字塔增强网络的小尺度目标检测方法,包括:
(1)确定网络编码端的主干网络:以残差网络作为主干网络,残差网络包含5个卷积模块,每个卷积模块以一个池化层pooling或者步长为二的卷积层 stride convolution开始;
(2)设计Bottom-up特征金字塔:在bottom-up特征金字塔的构造过程中,每次特征融合操作将两路特征用对应元素相加的操作完成,一路由当前尺度的主干网络的pooling层或步长为二的卷积层的输出经过一个卷积核为1x1的卷积层进行通道特征融合和通道方向维度调整,调整后的通道为统一的256,另一路为bottom-up金字塔结构中前一次特征融合后经过一个卷积核为3x3,步长为二,输出通道数为256的卷积层之后的输出,从主干网络的第三个卷积模块开始连续做三个尺度的融合;
(3)设计Top-down特征金字塔:在top-down 特征金字塔的构造过程中,每次特征融合操作将三路特征用对应元素相加的操作融合,第一路为与当前融合模块输出尺度相同的主干网络的卷积模块最后一层的输出经过一个卷积核为1的卷积层融合通道特征并调整通道方向维度为统一的256之后的输出,第二路为bottom-up金字塔上与当前融合模块输出尺度的1/2尺度对应的特征融合模块的输出经过一个卷积核为3x3,输出通道数为256的卷积层,再经过一个倍数为2的上采样的输出,第三路为top-down金字塔上与当前融合模块输出尺度的1/2尺度对应的特征融合模块的输出经过一个卷积核为3x3,输出通道数为256的卷积层,再经过倍数为2的上采样的输出,在top-down特征金字塔中从主干网络的最后一个卷积模块的输出开始连续做三个尺度的融合;
(4)目标检测子网络:采用faster-rcnn中两阶段检测的策略,分别为候选框提取阶段和目标分类阶段,RPN阶段在top-down特征金字塔的每个尺度的输出特征图上采用卷积核为3x3的卷积进行目标框的回归和是否是目标的概率的预测,经过筛选后的候选目标框再与对应尺度top-down特征金字塔的输出特征图做ROI-pooling,最后使用两个全连接层进行框的调整和目标具体类别的分类;
(5)输出物体检测结果:给定输入图像,经过主干网络的特征提取,和bottom-up特征金字塔与top-down特征金字塔的特征融合,在top-down特征金字塔融合后的特征图上进行候选目标框的提取和分类,输出目标的位置和尺度由RPN阶段输出的候选目标框的位置信息经过目标分类阶段对位置信息回归的调整之后输出最终的位置和尺度,目标的类别由目标分类阶段的输出确定;由解码端多尺度特征空间与语义空间的融合,得到高分辨率的预测图,预测图经过上采样到与图像一致的尺度,进而得到输入图像的像素级语义分割图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811219005.8/1.html,转载请声明来源钻瓜专利网。