[发明专利]一种漂移检测的残差深度特征目标跟踪方法有效
申请号: | 201810558287.8 | 申请日: | 2018-06-01 |
公开(公告)号: | CN108961308B | 公开(公告)日: | 2021-07-02 |
发明(设计)人: | 胡昭华;郑伟;钱坤 | 申请(专利权)人: | 南京信息工程大学 |
主分类号: | G06T7/246 | 分类号: | G06T7/246;G06K9/62 |
代理公司: | 南京经纬专利商标代理有限公司 32200 | 代理人: | 朱桢荣 |
地址: | 210032 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 漂移 检测 深度 特征 目标 跟踪 方法 | ||
1.一种漂移检测的残差深度特征目标跟踪方法,其特征在于,包括以下步骤:
步骤一、训练残差深度特征网络;
残差深度特征网络的结构包括4个卷积层、2个全连接层和1个残差结构;4个卷积层分别是conv1、conv2、conv3和conv4,2个全连接层分别是fc5和fc6,其中,conv1、conv2、conv3和conv4分别为第一卷积层、第二卷积层、第三卷积层和第四卷积层,fc5为第一全连接层,fc6为第二全连接层、也是网络输出层;
conv1、conv2、conv3、conv4、fc5和fc6依次顺序连接,残差结构用于将第二卷积层输出特征与第四卷积层输出特征进行线性相加,再通过激活函数输出,实现不同层的输出特征融合,对目标和背景进行分类;
步骤二、从当前帧裁剪得到的样本集,该样本集输入步骤一训练得到的残差深度特征网络,输出残差深度特征网络conv4的值,conv4输出值与相对应的回归标签构成训练样本集,根据训练样本集训练目标模板并且定位当前帧目标;
步骤二具体如下:
设训练样本集为(X,Y),从当前帧裁剪得到的样本集,该样本集输入到步骤一训练完成的残差深度特征网络,残差深度特征网络中的conv4层输出的值为样本集特征X,Y表示X对应的回归标签;训练样本集中第i个样本表示为(xi,yi),其中,xi表示训练样本集中第i个特征,yi表示xi对应的回归标签,i=1,2,…N,N为训练样本总数;
训练样本集线性可分时,线性回归函数表示为f(xi)=wTxi,上标T表示转置,通过求解公式(1),即最小化损失函数,确定w;
其中,f(xi)表示xi对应的预测回归标签,λ代表正则化系数,w表示权重系数,公式(1)写成矩阵形式为
其中X=[x1,x2,...,xN]T,X中每一行代表一个训练样本,Y是列向量,Y中列向量的每个元素代表X中行代表的训练样本对应的回归标签,求解公式(2)得目标模板
w=(XHX+λI)-1XHY (3)
其中上标H表示复共轭转置,I表示单位矩阵;
涉及到求逆运算,引入循环矩阵,训练样本集中的所有样本是由定义所跟踪的目标在图片中位置样本循环移位所得,定义跟踪的目标在图片中的位置的样本记为目标样本;所有的循环矩阵都能够在傅氏空间中使用离散傅里叶矩阵进行对角化,则
其中,Xp是目标样本循环移位得到的训练样本集,每一行代表一个训练样本,xp代表目标样本,初始帧的目标样本是根据给定的需要定位的目标位置得到,随后的目标样本是根据当前帧的前一帧预测的位置得出置,是xp的傅里叶变换,上标∧均表示傅里叶变换,F是傅里叶变换矩阵;初始帧确定的训练样本集对应的回归标签记为y,带入公式(3)解得目标模板为
其中上标*表示共轭,⊙表示点乘;
若遇到训练样本集线性不可分,引入核函数φ(Xp),训练样本集Xp映射到核空间线性可分;令K表示核空间的核矩阵,
其中表示Xp在变换空间上的自相关,若是循环矩阵,则目标模板
检测阶段得到测试样本集ZP的响应矩阵,ZP是在检测阶段,根据上一帧预测当前帧目标位置确定的目标样本zp循环移位得到的测试样本集,表示XP和ZP在变换空间上的互相关;
响应矩阵fp计算如公式(9)所示,
其中,φ(Zp)表示测试样本集Zp映射到核空间,则预测目标位置是fP中元素最大值位置,即
其中,p(r,c)表示预测出的目标位置;
步骤三、检测模型漂移策略;
通过确定响应矩阵的峰值强度PSR连续下降现象来确定目标模板出现问题的位置;具体如下:
响应矩阵fp是由当前帧测试样本集和初始帧训练样本集,根据计算得出,其中,ZP为测试样本集,XP为训练样本集,K表示核空间的核矩阵,上标∧均表示傅里叶变换;表示训练样本集Xp和测试样本集ZP在傅里叶变换域的互相关计算,其中表示XP进行傅里叶变换,表示ZP进行傅里叶变换;
响应矩阵的峰值强度计算如下式所示,
其中PSR为峰值强度,max_fp表示响应矩阵fp中元素最大值,μ表示fp中旁瓣的平均值,σ表示fp中旁瓣的标准差;
定义一个响应强度下降计数器counter,初始帧数值为0,设置计数器阈值为η,通过计数器的数值判断PSR连续下降的现象是否出现;设第t帧的PSR为a,第(t+1)帧的PSR为b,若b-a<0,则counter数值加1,若b-a>=0,则counter数值变为0,每一帧计算响应矩阵,计算counter数值,若counter>η,判断当前帧跟踪出现问题,上一帧更新的目标模板不适合定位当前帧目标,出现模型漂移;
步骤四、更新目标模型;
目标模型包含目标模板和外观模型,通过更新目标模板和外观模型实现对目标的精确跟踪;
若counter<=η,判断当前帧定位准确,计算目标位置其中,r,c分别表示目标位置坐标的横坐标和纵坐标,按照以下公式对第(t+n)帧进行目标模板和外观模型的更新,其中n≥1;
model_wt+n=(1-γ)model_wt+n-1+γwt+n
model_xt+n=(1-γ)model_xt+n-1+γxt+n
其中model_wt+n-1表示第(t+n-1)帧的目标模板,wt+n表示第(t+n)帧的目标模板,model_wt+n表示更新后的目标模板;model_xt+n-1表示第(t+n-1)帧的外观模型,xt+n表示第(t+n)帧的外观模型,model_xt+n表示更新后的外观模型,γ表示比例系数,是决定前一帧模板信息与当前帧模板信息的融合权重;
若counter>η,判断当前帧定位不准确,计算目标位置按照以下公式进行目标模板和外观模型的更新;
model_wt+n=model_wt+n-η
model_xt+n=model_xt+n-η
目标模板和外观模型更新后,在下一帧图像,实现目标定位,再进行目标模板和外观模型更新,直至所有图像完成目标跟踪。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京信息工程大学,未经南京信息工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810558287.8/1.html,转载请声明来源钻瓜专利网。