[发明专利]基于卷积特征和全局搜索检测的长时遮挡鲁棒跟踪方法有效
申请号: | 201710204379.1 | 申请日: | 2017-03-31 |
公开(公告)号: | CN106952288B | 公开(公告)日: | 2019-09-24 |
发明(设计)人: | 李映;林彬;杭涛 | 申请(专利权)人: | 西北工业大学 |
主分类号: | G06T7/231 | 分类号: | G06T7/231;G06T7/70;G06T7/20;G06T7/262;G06T7/277;G06T7/269 |
代理公司: | 西北工业大学专利中心 61204 | 代理人: | 王鲜凯 |
地址: | 710072 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 卷积 特征 全局 搜索 检测 遮挡 跟踪 方法 | ||
1.一种基于卷积特征和全局搜索检测的长时遮挡鲁棒跟踪方法,其特征在于步骤如下:
步骤1:读取视频中第一帧图像数据以及目标所在的初始位置信息[x,y,w,h],其中x,y表示目标中心的横坐标和纵坐标,w,h表示目标的宽和高;将(x,y)对应的坐标点记为P,以P为中心,大小为w×h的目标初始区域记为Rinit,再将目标的尺度记为scale,初始化为1;
步骤2:以P为中心,确定一个包含目标及背景信息的区域Rbkg,Rbkg的大小为M×N,M=2w,N=2h;采用VGGNet-19作为CNN模型,在第5层卷积层即conv5-4层对Rbkg提取卷积特征图ztarget_init;然后根据ztarget_init构建跟踪模块的目标模型t∈{1,2,...,T},T为CNN模型通道数,计算方法如下:
其中:大写的变量为相应的小写变量在频域上的表示,高斯滤波模板m,n为高斯函数自变量,m∈{1,2,...,M},n∈{1,2,...,N},σtarget为高斯核的带宽,⊙代表元素相乘运算,上划线表示复共轭,λ1为调整参数;
步骤3:以P为中心,提取S个不同尺度的图像子块,S设定为33;每个子块的大小为w×h×s,变量s为图像子块的尺度因子,s∈[0.7,1.4];然后分别提取每个图像子块的HOG特征,合并后成为一个S维的HOG特征向量,并命名为尺度特征向量,记为zscale_init;再根据zscale_init构建跟踪模块的尺度模型Wscale,计算方法如下:
其中,s'为高斯函数自变量,s'∈{1,2,...,S},σscale为高斯核的带宽,λ2为调整参数;
步骤4:对目标初始区域Rinit提取灰度特征,得到灰度特征表示的二维矩阵,命名为目标外观表示矩阵,记为Ak,下标k表示当前帧数,初始时k=1;然后将检测模块的滤波模型D初始化为A1,即D=A1,再初始化历史目标表示矩阵集合Ahis;Ahis存储当前及之前每一帧的目标外观表示矩阵,即Ahis={A1,A2,...,Ak},初始时Ahis={A1};
步骤5:读取下一帧图像,仍然以P为中心,提取大小为Rbkg×scale的经过尺度缩放后的目标搜索区域;然后通过步骤2中的CNN网络提取目标搜索区域的卷积特征,并以双边插值的方式采样到Rbkg的大小得到当前帧的卷积特征图ztarget_cur,再利用目标模型计算目标置信图ftarget,计算方法如下:
其中,为傅里叶逆变换;最后更新P的坐标,将(x,y)修正为ftarget中的最大响应值所对应的坐标:
步骤6:以P为中心,提取S个不同尺度的图像子块,然后分别提取每个图像子块的HOG特征,合并后得到当前帧的尺度特征向量zscale_cur,同步骤3中zscale_init的计算方法;再利用尺度模型Wscale计算尺度置信图:
最后更新目标的尺度scale,计算方法如下:
得到跟踪模块在当前第k帧的输出:以坐标为(x,y)的P为中心,大小为Rinit×scale的图像子块TPatchk;另外,将已经计算完成的ftarget中的最大响应值简记为TPeakk,即TPeakk=ftarget(x,y);
步骤7:检测模块以全局搜索的方式将滤波模型D与当前帧的整幅图像进行卷积,计算滤波模型D与当前帧各个位置的相似程度;取响应度最高的前j个值,并分别以j个值对应的位置点为中心,提取大小为Rinit×scale的j个图像子块;将j个图像子块作为元素,生成一个图像子块集合DPatchesk,即检测模块在第k帧的输出;
步骤8:分别计算检测模块输出的集合DPatchesk中各图像子块与跟踪模块输出的TPatchk之间的像素重叠率,得到j个值,将其中最高的值记为如果小于阈值判定为目标被完全遮挡,需要抑制跟踪模块在模型更新时的学习率β,并转步骤9;否则按初始学习率βinit进行更新,并转步骤10;
所述β的计算公式如下:
步骤9:根据DPatchesk中各图像子块的中心,分别提取大小为Rbkg×scale的j个目标搜索区域,按照步骤5中的方法对每一个目标搜索区域提取卷积特征图并计算目标置信图,得到j个目标搜索区域上的最大响应值;在j个响应值中的最大的值记为DPeakk;如果DPeakk大于TPeakk,则再次更新P的坐标,将(x,y)修正为DPeakk所对应的坐标;并重新计算目标尺度特征向量和目标尺度scale,采用步骤6中的计算方式;
步骤10:目标在当前帧最优的位置中心确定为P,最优尺度确定为scale;在图像中标示出新的目标区域Rnew,以P为中心,宽和高分别为w×scale、h×scale的矩形框;另外,将已经计算完成、并且能够得到最优目标位置中心P的卷积特征图简记为ztarget;同样,将能够得到最优目标尺度scale的尺度特征向量简记为zscale;
步骤11:利用ztarget、zscale,以及上一帧建立的跟踪模块中的目标模型和尺度模型Wscale,分别以加权求和的方式进行模型更新,计算方法如下:
Wscale=Wscale_new;
步骤12:对新的目标区域Rnew提取灰度特征后得到当前帧的目标外观表示矩阵Ak,将Ak加入到历史目标表示矩阵集合Ahis;如果集合Ahis中元素个数大于c,则从Ahis中随机选择c个元素生成一个三维矩阵Ck,Ck(:,i)对应的是Ahis中任意一个元素、即二维矩阵Ak;否则用Ahis中所有元素生成矩阵Ck;然后对Ck进行平均化得到二维矩阵,将这个二维矩阵作为检测模块新的滤波模型D,计算方法如下:
步骤13:若处理完视频中所有的图像帧则算法结束,否则转步骤5继续执行。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西北工业大学,未经西北工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710204379.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种高效的管材外壁打磨装置
- 下一篇:用于手动喷砂的翻转机构