[发明专利]基于上下文约束编码的目标跟踪方法有效
申请号: | 201310404988.3 | 申请日: | 2013-09-08 |
公开(公告)号: | CN103473560A | 公开(公告)日: | 2013-12-25 |
发明(设计)人: | 田小林;焦李成;尚小维;王爽;刘宪龙;张小华 | 申请(专利权)人: | 西安电子科技大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 陕西电子工业专利中心 61205 | 代理人: | 王品华;朱红星 |
地址: | 710071*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开一种基于上下文约束编码的目标跟踪方法,主要解决目标发生快速运动、光照变化、外观剧烈变化导致跟踪失败的问题。实现步骤为:(1)输入一段视频第一帧,人工标记出待跟踪目标;(2)获取搜索窗与正负样本;(3)提取搜索窗特征描述子构建字典,提取正负样本特征描述子进行编码,训练分类器模型;(4)载入新一帧视频图像,获取检测样本,提取特征描述子并编码;(5)利用分类器对检测样本的编码进行分类预测,估计出待跟踪目标位置;(6)根据跟踪位置获取正负样本和搜索窗,更新字典,升级分类器,执行下一帧。本发明确保了图像空间位置的一致性,提高了目标跟踪的稳定性和准确性,可用于交通管制、安全监测、医学图像方面。 | ||
搜索关键词: | 基于 上下文 约束 编码 目标 跟踪 方法 | ||
【主权项】:
1.一种基于上下文约束编码的目标跟踪方法,包括以下步骤: (1)输入一段视频的第一帧,人工标记出待跟踪的目标,得到跟踪框的位置; (2)以跟踪框位置为中心获取49个正样本和49个负样本,将涵盖所有正负样本的范围定义为搜索窗; (3)构建第一帧字典Bt: 根据dense-sift方法,提取搜索窗的特征描述子;再根据k-means聚类方法对这些特征描述子进行聚类,得到第一帧字典Bt,上标t表示当前正在处理的图像帧数,这里,t=1; (4)根据dense-sift方法,提取所有正负样本的每个像素点的特征描述子
并根据特征描述子
和第一帧字典Bt计算第一帧所有正负样本像素点的编码
其中,下标i表示样本的第i个像素点;(5)训练分类器参数wt: 将正样本类标记为1,将负样本类标记为2,根据正负样本的类标及正负样本的编码
利用交叉验证方法训练得到libsvm分类器参数wt;(6)载入新一帧视频图像,以上一帧目标的跟踪框位置为中心获取98个样本,作为本帧的检测样本,并根据dense-sift方法提取这些检测样本特征描述子
(7)计算本帧检测样本每个像素点的编码
7a)根据本帧检测样本的特征描述子
和上一帧字典Bt-1,计算本帧检测样本每个像素点的编码
7b)将本帧检测样本像素点i对应到上一帧图像中,对应到的像素点记为i′, 取出i′的7*7邻域内像素点的编码,将这些像素点编码记作
计算本帧检测样本像素点编码
与对应到的上一帧样本像素点编码
的相似距离,在这49个相似距离中,选取出最小距离对应的像素点编码![]()
其中,min(·)表示求最小值,||·||表示求一范数,arg表示选取
求出的最小距离所对应的像素点编码;7c)根据所述像素点编码
和上一帧字典Bt-1,利用下式求解本帧检测样本像素点的编码![]()
![]()
其中,||·||2表示求二范数,N表示样本中像素点的总个数,λ是系数因子,取值为0.1,符号“s.t.”表示约束条件,约束条件中的1表示元素值全为1的向量,(·)T表示转置,符号
表示i可以取1~N中的任意一个数;(8)根据上一帧训练的分类器参数,利用线性回归方法对本帧检测样本的像素点编码进行分类预测,根据预测的最大决策值估计出本帧待跟踪目标的位置; (9)以估计出的待跟踪目标位置为中心,按照步骤(2)的方法获取本帧正负样本的精确位置和搜索窗位置; (10)构建本帧字典Bt: 根据dense-sift方法,提取本帧搜索窗的特征描述子;再根据k-means聚类方法,计算这些特征描述子与上一帧字典的接近程度得到新的聚类中心Bt′,将新的聚类中心Bt′与上一帧字典Bt-1加权求和计算得到本帧字典Bt: Bt=αBt-1+(1-α)Bt′, 其中,α为权值系数,取值为0.85; (11)根据dense-sift方法,提取本帧正负样本的特征描述子
(12)计算本帧正负样本每个像素点的编码
12a)按照步骤(4)的方法,根据本帧正负样本的特征描述子
和本帧字典Bt,计算本帧正负样本每个像素点的编码
12b)按照步骤7b)和步骤7c)的方法,根据步骤12a)计算的本帧正负样本每个像素点的编码
和本帧Bt,求解出本帧正负样本每个像素点的编码
(13)计算本帧分类器参数wt: 按照步骤(5)的方法训练出本帧分类器参数wt′,将上一帧分类器参数wt-1和本帧训练出的分类器参数wt′进行加权求和,计算得到本帧分类器参数wt: wt=βwt-1+(1-β)wt′, 其中,β是更新系数,取值为0.93; (14)返回步骤(6)执行下一帧。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201310404988.3/,转载请声明来源钻瓜专利网。