[发明专利]一种基于多尺度特征图的目标快速检测方法有效
申请号: | 201810417918.4 | 申请日: | 2018-05-04 |
公开(公告)号: | CN108510012B | 公开(公告)日: | 2022-04-01 |
发明(设计)人: | 何小海;单倩文;滕奇志;吴晓红;卿粼波;王正勇;余艳梅 | 申请(专利权)人: | 四川大学 |
主分类号: | G06V10/52 | 分类号: | G06V10/52;G06V10/80;G06V10/82;G06K9/62;G06N3/04 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 610065 四川*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 尺度 特征 目标 快速 检测 方法 | ||
1.一种基于多尺度特征图的目标快速检测方法,其特征在于包括以下步骤:
步骤一:搭建卷积神经网络,以包含5组卷积层的VGG-16模型作为基础网络,并添加多个额外的卷积层,初步提取多尺度的卷积特征图;
步骤二:构建卷积特征图融合模块,将基础网络中Conv5_3层与FC7层的特征图进行融合,增加特征来源,丰富上下文信息;
步骤三:使用一种压缩型双线性函数实现特征图的融合,得到融合后的特征图;
步骤四:将多尺度特征图通过先Squeeze再Excitation的操作得到不同通道的权重,并将此权重和原特征图相乘以实现将多尺度特征图与通道注意机制结合,进一步增强特征图的判别能力;
步骤五:将增强后的多尺度特征图输入检测模型,在训练阶段同时对目标位置和类别进行回归,通过多次迭代最小化损失函数,直至得到最终的检测模型。
2.根据权利要求1所述的基于多尺度特征图的目标快速检测方法,其特征在于:步骤一中所述的卷积神经网络模型包括从Conv1到Conv5的5组卷积层,由全连接层转变的卷积层FC6和FC7,末端添加的一系列级联卷积层,及激活层、池化层。
3.根据权利要求1所述的基于多尺度特征图的目标快速检测方法,其特征在于:步骤二中所述构建卷积特征图融合模块:卷积神经网络通过不同的卷积核自行提取特征,将原始数据经过一些非线性变换转变为更高层次的、更加抽象的表达,再进行分类识别,考虑到每一个卷积层所学习的特征表达均不同,在采用6组不同特征图的基础上,增加了基础网络中卷积层Conv5_3的特征图,并将其与FC7层特征图进行融合,以增强特征图的表达能力。
4.根据权利要求1所述的基于多尺度特征图的目标快速检测方法,其特征在于:步骤三所述的融合方法包括以下步骤:
(1)考虑到待融合的卷积特征图通道数不同,在融合之前先引入卷积核大小为1×1的卷积层,在通道的维度上进行线性组合,以统一特征图的通道数;
(2)采用压缩型双线性函数来实现卷积特征图的融合,将传统的双线性变换看成一种多项式核函数,并根据Tensor Sketch方法来计算出融合后的D维向量,令F1,F2∈RH×W×C分别表示两组特征图,H、W和C分别表示特征图的长、宽和通道数,则在位置(h,w)处分别存在C维的特征向量f1(h,w),f2(h,w)∈RC,这里h∈[1,H],w∈[1,W],为方便表示后面均省略了(h,w),首先利用Count Sketch函数Ψ将特征向量fk∈RC映射到特征空间,k=1,2,定义两个向量vk∈{-1,1}C,rk={1,...,D}C,服从均匀分布初始化,并在之后的调用中保持不变,这里rk用于寻找特征向量的第i个元素fk(i)在特征空间中对应的索引j=rk(i),则有
Ψ(fk,rk,vk)={Q1,Q2,...QD} (1)
式中i∈{1,...,C},j∈{1,...,D},其次,两个向量外积的Count Sketch通过计算各自Count Sketch的卷积得到,即
式中*表示卷积运算,另外,卷积定理指出,时域中的卷积等价于频域中的乘积,于是上述公式(3)进一步表示为
式中表示逐元素乘积;
(3)为了使融合后的卷积特征保持二维特征图的形式,不进行池化运算,令融合后的特征图先经过求平方根处理,再通过卷积核大小为1×1的卷积层恢复至C个通道,最后通过L2正则化生成最终的特征图,作为后续网络结构的输入。
5.根据权利要求1所述的基于多尺度特征图的目标快速检测方法,其特征在于:步骤四中所述,将融合后的多尺度特征图与通道注意机制结合,即在特征检测网络的浅层和深层位置均置入通道注意机制,学习特征图不同通道之间的相互关系,自适应地调整各通道权重,给定一组卷积特征图F∈RH×W×C,通道数为C,首先利用全局平均池化对其进行Squeeze操作,将每个通道中的特征图大小变为1×1,使之具有全局感受野,生成向量Z∈R1×1×C,i∈[1,C],即
其次是Excitation操作,构造一种基于Sigmoid函数的简单门限机制,来自适应地学习各个通道的权重,先是通过全连接层将通道数降到原本的1/16,经ReLu激活层后通过下一个FC层还原至C个通道,以更好地拟合通道之间复杂的非线性关系,之后利用Sigmoid函数将各个通道的权重归一化至区间[0,1],这一过程表示为
ω=Sigmoid[W2δ(W1f)] (6)
式中δ为ReLU激活函数,f为输入的向量,W1和W2分别对应两个FC层的权重,最后,通过乘法操作将各个通道的权重赋予相应的原始特征图,完成通道特征的自适应标定过程。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川大学,未经四川大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810417918.4/1.html,转载请声明来源钻瓜专利网。