[发明专利]一种基于高阶偏最小二乘法的目标跟踪算法有效
申请号: | 201410279523.4 | 申请日: | 2014-06-20 |
公开(公告)号: | CN104021395B | 公开(公告)日: | 2017-05-03 |
发明(设计)人: | 钟必能;王田;沈映菊;陈雁;谢维波;陈锻生;陈维斌 | 申请(专利权)人: | 华侨大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06T7/292 |
代理公司: | 厦门市首创君合专利事务所有限公司35204 | 代理人: | 张松亭 |
地址: | 362000*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于高阶偏最小二乘法的目标跟踪算法,包括初始化阶段、训练阶段、测试阶段,和更新阶段。本发明以二维张量来表示图像块,保存了该图像块内在的空间结构信息,同时,本发明综合了多个时序的图像块及其类别来建立高阶张量,并以偏最小二乘法来分析该高阶张量与其类别矩阵的关联之处,使目标跟踪算法的性能大大提高。 | ||
搜索关键词: | 一种 基于 高阶偏 最小二乘法 目标 跟踪 算法 | ||
【主权项】:
一种基于高阶偏最小二乘法的目标跟踪算法,其特征在于,包括初始化阶段、训练阶段、测试阶段,和更新阶段;所述初始化阶段包括:指定一个目标物体,并设定以该目标物体的中心为中心的n‑1种不同相对方位为该目标物体的n‑1种非目标方位;将当前时刻记为t时刻,并提取从t‑m时刻到t时刻的m帧图像,其中m为一个预先设定的正整数;针对所提取的每一帧图像,人为找到该图像中的目标物体,以该目标物体的中心为中心截取包含该目标物体的1个第一图像块,之后分别以该目标物体的n‑1种非目标方位为中心截取n‑1个第二图像块,其中n为一个预先设定的大于1的正整数;所有第一图像块和所有第二图像块的大小均一致;将所截取的每个第一图像块和每个第二图像块均用一个I1×I2的特征矩阵表示,I1和I2均为一个预先设定的正整数;将当前的m个第一图像块组成一个图像集,并记为目标图像集;将当前以同一种非目标方位为中心的第二图像块组成一个图像集,并记为非目标图像集,得到n‑1个非目标图像集;将t时刻的一帧图像中目标物体的中心位置设为当前位置;然后转入训练阶段;所述训练阶段包括:A1、将当前的目标图像集的类别标记为目标类,将当前的n‑1个非目标图像集的各类别分别标记为第1非目标类、第2非目标类、…第n‑1非目标类;然后将所述目标类、第1非目标类、第2非目标类、…第n‑1非目标类分别对应n个类别行向量,记为y1,y2,…,yn,其中,yi=[0,0,…,1,…,0],i=1,2,…,n,是除了第i个元素为1之外,其余全为0的向量,当i=1时,其含义表示目标类,当1<i≤n时,其含义表示第i‑1非目标类;A2、基于当前的1个目标图像集和n‑1个非目标图像集构建一个高阶张量,记为X,且其中第一阶的n表示n个类别,第二阶和第三阶的I1×I2表示所截取的图像块的特征矩阵大小为I1×I2,第四阶的m表示m帧图像;将所述n个类别行向量y1,y2,…,yn依照X的第一阶中n个类别的顺序从上到下排列、构建成一个X的类别矩阵,记为Y,得出Y∈Rn×n;A3、利用高阶偏最小二乘法,分别将X和Y分解为X=Σr=1RGr×1tr×2Pr(1)×3Pr(2)×4Pr(3)+ER---(1)]]>Y=Σr=1RurqrT+FR---(2)]]>其中,R表示对X和Y的分解进行R次迭代,Gr表示X的第r次迭代的核心张量,tr表示X的第r次迭代的隐藏向量,为X第r次迭代的三个加载矩阵,ur为Y第r次迭代的隐藏向量,qr为Y第r次迭代的加载向量,ER为X经过R次迭代后所得的残差张量,FR为Y经过R次迭代后所得的残差矩阵,tr、ur和qr均为列向量;同时,||qr||=1,||tr||=1,以及A4、将对当前的X进行R次迭代所得的所有隐藏向量组成一个隐藏矩阵,记为TR,则TR=[t1,t2,…,tR];将对当前Y进行R次迭代所得的所有隐藏向量组成一个隐藏矩阵,记为U,则U=[u1,u2,…uR];对U与TR作关联处理,得出U=TRD+Z,其中D是对角矩阵,Z是高斯残差;将公式(2)中的Y分解改写为:Y=Σr=1RurqrT+FR=Σr=1RdrtrqrT+FR,---(3)]]>其中,dr为D的第r个对角元素,FR'=FR+ZQ,Q为由q1,q2,…qR构成的矩阵,Q=[q1,q2,…qR];A5、根据公式(1),设定X1=X=G1×1t1×2P1(1)×3P1(2)×4P1(3)+E1X2=X1-G1×1t1×2P1(1)×3P1(2)×4P1(3)=E1......XR=XR-1-GR-1×1tR-1×2PR-1(1)×3PR-1(2)×4PR-1(3)=ER-1---(4)]]>其中,ER‑1为X经过R‑1次迭代后所得的残差张量;同理根据公式(3),得出Y1,Y2,…YR,之后根据max{Pr(j),qr}||Xr×1YrT×1qrT×2Pr(1)T×3Pr(2)T×4Pr(3)T||F2||qr||F=1---(5)]]>同时,设定Cr=Xr×1YrT,利用高阶奇异值分解依次计算出Cr的单次迭代的核心张量Gr(C),并求解出和qr,然后根据t1←(X1×2P1(1)T×3P1(2)T×4P1(3)T)(1)G1(1)(C)+,t1←t1/||t1||Ft2←(X2×2P2(1)T×3P2(2)T×4P2(3)T)(1)G2(1)(C)+,t2←t2/||t2||F......tR←(XR×2PR(1)T×3PR(2)T×4PR(3)T)(1)GR(1)(C)+,tR←tR/||tR||F---(6)]]>依次求解出t1,t2,…tR;最后根据d1=t1Tu1=t1TY1q1d2=t2Tu2=t2TY2q2......dR=tRTuR=tRTYRqR---(7)]]>依求解出d1,d2,…dR;然后转入测试阶段;所述测试阶段包括:B1、提取下一时刻的一帧图像,设定该图像上以所述当前位置为中心、以指定半径长度为半径的圆形区域为该图像的搜索区域;转入步骤B2;B2、在当前一帧图像的搜索区域中选取至少一个位置,作为当前一帧图像的测试位置;对于当前一帧图像的每个测试位置,分别以该测试位置为中心提取图像块,作为该测试位置的测试图像块;所有测试图像块大小均一致,且与所述初始化阶段中第一图像块或第二图像块的大小一致;转入步骤B3;B3、将当前所提取的每个测试图像块均用一个I1×I2的特征矩阵表示;针对所提取的每个测试图像块:将该测试图像块与当前的目标图像集中的所有图像块一起组成一个新的图像集,记为测试图像集,然后基于该测试图像集构建一个新的高阶张量,记为Xnew,且将该测试图像块对应的类别行向量设为ynew,则ynew≈XnewWDQT (8)其中,W是R列的矩阵,每一列表示为wr=(Pr(3)⊗Pr(2)⊗Pr(1))Gr+---(9)]]>由公式(8)和(9)计算出ynew=[β,γ1,γ2,...,γn‑1],其中β表示该测试图像块对应目标类的概率,γk表示该测试图像块对应第k非目标类的概率,其中,k=1,...,n‑1;计算出当前所有测试图像块对应的类别行向量后,转入步骤B4;B4、根据这些测试图像块对应的类别行向量,选取其中与所述目标类对应的类别行向量最接近的一个,若该类别行向量与所述目标类对应的类别行向量的差值大于预设的阈值,则舍弃当前所获取的所有测试图像块,并转入步骤B2;若该类别行向量与所述目标类对应的类别行向量的差值小于或等于预设的阈值,则转入更新阶段;所述更新阶段包括:C1、将所述当前位置更新为所选取的类别行向量所对应的测试图像块的测试位置,并记录跟踪;然后,将该测试图像块添加到当前的目标图像集中并将该目标图像集中对应时刻最早的一个图像块删除,得到1个新的目标图像集;C2、以所述当前位置为中心获取当前一帧图像中目标物体的n‑1种非目标方位;之后,分别以这n‑1种非目标方位为中心提取n‑1个图像块,这n‑1个图像块的大小均与所述初始化阶段中第一图像块或第二图像块的大小一致;然后,将这n‑1个图像块根据所围绕的非目标方位、分别添加到当前的n‑1个非目标图像集中,并将这n‑1个非目标图像集中对应时刻最早的一个图像块删除,得到n‑1个新的非目标图像集;C3、将当前目标图像集中所有图像块和当前n‑1个非目标图像集中所有图像块均用一个I1×I2的特征矩阵表示,转入训练阶段。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华侨大学,未经华侨大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201410279523.4/,转载请声明来源钻瓜专利网。