[发明专利]一种基于孪生渐进注意引导融合网络的视觉目标跟踪方法有效
申请号: | 202010653263.8 | 申请日: | 2020-07-08 |
公开(公告)号: | CN111860248B | 公开(公告)日: | 2021-06-25 |
发明(设计)人: | 宋晓宁;范颖;冯振华 | 申请(专利权)人: | 上海蠡图信息科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04 |
代理公司: | 南京禹为知识产权代理事务所(特殊普通合伙) 32272 | 代理人: | 朱宝庆 |
地址: | 上海市宝山区高逸路*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 孪生 渐进 注意 引导 融合 网络 视觉 目标 跟踪 方法 | ||
1.一种基于孪生渐进注意引导融合网络的视觉目标跟踪方法,其特征在于:包括以下步骤,
利用孪生主干网络负责提取示例样本和搜索样本的多层特征表示;
定义特征聚合模块,对各层信息进行逐步地编码融合,将高层特征信息和浅层特征信息有选择性地结合以生成综合增强的特征表示;
在所述特征聚合模块中引入注意引导模块,细化特征表示并抑制噪声带来的干扰,使融合的特征更具代表性;
构建孪生渐进注意引导融合网络跟踪器用于视觉目标跟踪;
其中,所述孪生主干网络包括以下步骤,
采用改进的ResNet22;
定义网络分为3个阶段、总体步长为8并由22个卷积层组成;
当卷积层使用填充后,使用裁剪操作来消除受到补零影响的特征计算,同时保持内部块结构不变;
在网络的前两个阶段中遵循原始的ResNet进行特征下采样;
在第三阶段,由步长为2的最大池化来代替卷积层执行下采样,且该层位于本阶段的第一个块中,即layer2-1;
所述孪生主干网络包括两个相同的分支,分别为示例分支和搜索分支,其中,
所述示例分支接收示例样本的输入;
所述搜索分支接收搜索样本的输入;
所述示例分支和所述搜索分支在卷积神经网络中共享参数,以确保相同的转换用于这两个样本;
所述特征聚合模块包括,
接收两部分的输入,分别为来自对应层的低级特征、上一层通过所述注意引导模块产生的高级注意特征;
采用级联操作将上采样后的高级注意特征与低级特征融合。
2.如权利要求1所述的基于孪生渐进注意引导融合网络的视觉目标跟踪方法,其特征在于:所述特征聚合模块包括以下步骤,
所述注意引导模块生成的高级注意特征后被送入反卷积层deconv中,其中,l为层数索引;
所述反卷积层将特征上采样到与当前低级特征Sl-1相同的空间大小;
将上采样的高级注意特征和低级特征级联在一起,并通过1×1的卷积运算conv进行特征通道压缩,生成综合特征
3.如权利要求2所述的基于孪生渐进注意引导融合网络的视觉目标跟踪方法,其特征在于:包括以下步骤,
将融合后的综合特征输入到所述注意引导模块中生成注意特征
进行细化特征并减少噪声,即引导注意特征关注更具代表性的信息表示;
过程表示如下:
其中cat(·)表示级联操作、AttGuideM(·)表示注意引导模块。
4.如权利要求3所述的基于孪生渐进注意引导融合网络的视觉目标跟踪方法,其特征在于:包括以下步骤,
将生成的注意特征作为第(l-2)层的高级特征;
高级特征与低级特征Sl-2一起输入至对应层次的所述特征聚合模块中重复特征融合过程;
示例分支网络的第3阶段最后三块卷积层layer2-2、layer2-3和layer2-4的输出特征为l=3、卷积特征Sl∈{1,2,3};
逐层产生注意特征和其中注意特征为直接将示例分支网络顶层特征S3输入到所述注意引导模块生成的,即
分别将最终生成的特征以及顶层特征S3用来与搜索分支网络的对应层输出特征进行匹配相似度计算。
5.如权利要求4所述的基于孪生渐进注意引导融合网络的视觉目标跟踪方法,其特征在于:所述注意引导模块包括空间注意机制和通道注意机制;其中,
采用空间注意机制来引导融合特征去关注更代表性的特征区域,
采用通道注意机制从通道的角度上来对特征进行强化,通过将更大权重分配给对目标有更高反应的特征通道,改进对特定目标的特征表示。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海蠡图信息科技有限公司,未经上海蠡图信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010653263.8/1.html,转载请声明来源钻瓜专利网。