[发明专利]一种适用于RGB-D相机的快速目标跟踪方法有效
申请号: | 201810258190.5 | 申请日: | 2018-03-27 |
公开(公告)号: | CN108596947B | 公开(公告)日: | 2021-09-17 |
发明(设计)人: | 刘烨;聂建辉;荆晓远 | 申请(专利权)人: | 南京邮电大学 |
主分类号: | G06T7/223 | 分类号: | G06T7/223;H04N7/18;H04N13/204;H04N13/257 |
代理公司: | 南京纵横知识产权代理有限公司 32224 | 代理人: | 董建林;张赏 |
地址: | 210003 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 适用于 rgb 相机 快速 目标 跟踪 方法 | ||
1.一种适用于RGB-D相机的快速目标跟踪方法,其特征在于,包括如下步骤:
1)初始时刻,人工选定需要跟踪的目标,将目标所在的区域大小为(w0,h0)的RGB图像块同时作为模板T0和模板T1,其中,w0表示图像块的宽,h0表示图像块的高;
2)将模板T0所在的区域内所有像素点反投影到三维空间得到三维点云,计算三维点云的中心作为目标在0时刻的三维位置(X0,Y0,Z0),计算三维点云中的点与(X0,Y0,Z0)距离的最大值r;
3)分别利用模板T0和模板T1在相机获取的RGB图像的R、G、B三个通道上的图像进行模板匹配,得到6张二维响应图R1,R2,...,R6,并计算平均响应图R,计算方法如下:R=(R1+R2+...R6)/6;
4)利用相机拍摄得到的当前时刻的深度图像和给定的相机厂商提供的相机参数将平均响应图R中的每个点反投影到三维空间得到三维点云集合点云中的每个点的权值为平均响应图R中对应位置的值
5)将前一时刻跟踪得到的三维位置做初始值,用Parzen窗口方法得到步骤4)中三维点云集合的局部极大值所在位置,该位置即为目标在当前时刻的三维位置(Xt,Yt,Zt);
6)利用目标的当前位置(Xt,Yt,Zt),计算得到目标在当前时刻图像上的投影尺寸(wt,ht),其中,wt表示投影图像的宽,ht表示投影图像的高;
7)计算(Xt,Yt,Zt)在t时刻RGB图像上的投影(xt,yt),在图像上以(xt,yt)为中心取大小为(wt,ht)的图像块T;
8)利用图像块T更新模板T1,T0保持不变;
9)返回步骤3),直到相机停止拍摄得到新的图像。
2.根据权利要求1所述的一种适用于RGB-D相机的快速目标跟踪方法,其特征在于,所述步骤2)中目标在0时刻的三维位置(X0,Y0,Z0)分别为:
其中,(Xi,Yi,Zi)是0时刻三维点云中第i个点的坐标,n为点的总数。
3.根据权利要求1所述的一种适用于RGB-D相机的快速目标跟踪方法,其特征在于,所述步骤3)中模板匹配过程为:
计算模板T0或模板T1与相机获取的RGB图像内不同位置、但是尺寸与模板图像相同的子图像S的相似度,相似度通过计算模板图像与子图像S之间的归一化交叉相关性得到:
其中,和Si分别是T0和S的第i个元素,σ(T0)和分别是T0的方差和均值,σ(S)和分别是S的方差和均值。
4.根据权利要求1所述的一种适用于RGB-D相机的快速目标跟踪方法,其特征在于,所述步骤2)和步骤4)的反投影方法如下:
对于二维图像上的点(x,y),在深度图像上取得(x,y)的深度d,反投影后的三维位置X坐标为(x-cx)d/fx,Y坐标为(y-cy)d/fy,Z坐标为深度d,其中,cx,cy,fx,fy为相机厂商提供的相机参数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810258190.5/1.html,转载请声明来源钻瓜专利网。