[发明专利]一种融合Cuckoo搜索和KCF的突变运动目标跟踪方法有效
申请号: | 201710531498.8 | 申请日: | 2017-07-03 |
公开(公告)号: | CN107341820B | 公开(公告)日: | 2018-04-20 |
发明(设计)人: | 张焕龙;张建伟;李祖贺;陈宜滨;张秀娇;吴青娥;蒋斌;钱晓亮;贺振东;王延峰;郑玉彬 | 申请(专利权)人: | 郑州轻工业学院 |
主分类号: | G06T7/277 | 分类号: | G06T7/277 |
代理公司: | 郑州优盾知识产权代理有限公司41125 | 代理人: | 郑园,栗改 |
地址: | 450002 *** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 融合 cuckoo 搜索 kcf 突变 运动 目标 跟踪 方法 | ||
1.一种融合Cuckoo搜索和KCF的突变运动目标跟踪方法,其特征在于,其步骤如下:
步骤一:初始化目标状态参数、Cuckoo搜索机制和KCF跟踪方法的初始参数;
步骤二:利用KCF跟踪方法获得前k帧的k个最大响应值,计算置信度阈值的初始阈值;
步骤三:依据当前帧最大响应值与置信度阈值的关系,确定不同的基图像样本产生方式:当大于置信度阈值,随机选取基图像样本,执行KCF方法跟踪目标;当小于置信度阈值,采用Cuckoo搜索机制获取全局最优的目标预测状态,产生新的基图像样本,执行KCF方法跟踪目标;
步骤四:采用新的最大响应值动态更新置信度阈值,重复步骤一至步骤三实现突变运动目标的有效跟踪。
2.根据权利要求1所述的融合Cuckoo搜索和KCF的突变运动目标跟踪方法,其特征在于,所述目标状态参数为:读取第一帧图像的数据信息,确定目标在第一帧图像内的状态参数[px,py,width,high],其中,(px,py)为目标左上角像素点的坐标值,width为目标宽度,high为目标高度;Cuckoo搜索机制的参数为:初始图像块位置数num,位置发现概率pa,迭代优化次数iter;KCF跟踪方法的参数为:候选区域与目标区域的比例因子γ,计算置信度阈值的集合元素长度Len。
3.根据权利要求1所述的融合Cuckoo搜索和KCF的突变运动目标跟踪方法,其特征在于,所述KCF跟踪方法实现的步骤为:
A、依据基样本图像构造循环矩阵X;
候选区域的宽和高分别为γ*width和γ*high,γ>1,γ为候选区域与目标区域的比例因子,width为目标宽度,high为目标高度,将目标拉成列向量x=[x1,x2,…xn]T作为基样本向量,n=width*high,依据基样本向量的循环移位操作产生其他的候选样本,基样本向量和其产生的n-1个候选样本形成循环矩阵:
依据循环矩阵能够通过离散傅里叶变换实现对角化的性质,循环矩阵等价为:其中,F是离散傅里叶矩阵,是对基样本向量x进行离散傅里叶变换diag表示向量对角化操作;
B、跟踪问题的时域-频域转化,实现分类问题的求解;
xi为第i个训练样本,yi是其对应的回归值,训练的目标是求最小化平方误差下的权值w,从而获得决策函数f(z)=wTz,z是候选样本;将跟踪的目标样本从候选样本中分离,权值w通过下式获得:
其中,λ控制过度拟合的正则化因子;在复数域下权值w解的向量描述形式为:
w=(XHX+λI)-1XHy,(3)
其中,循环矩阵X的每行由训练样本xi形成,y是回归值yi的其中任意一个,I为识别矩阵,XH是共轭转换XH=(X*)T,X*是循环矩阵X的复共轭矩阵;
将循环矩阵的频域表示形式带入线性求解公式:
则公式(4)改写成:⊙为逐元素的点乘操作,代入到在复数域下权值w解的向量描述形式中获得频率域内的表达式如下:
其中,表示y的傅里叶变换;
利用核技巧将一个线性问题的输入映射到非线性的特征空间上,w在特征空间上被表示为问题转换成求解系数αi和非线性映射的关系,获得系数αi组成的向量α的频率域表示:
其中,kxx是核循环矩阵k=C(kxx)的第一行元素,^代表向量的傅里叶变换;
C、获得最大响应值,确定跟踪目标;
通过公式(6)获得向量α的值,得到线性回归问题中的权值w,然后通过分类器的分类方式实现目标检测,选取候选样本z,则:
其中,kxz是基样本向量x和候选样本z的核相关性,决策函数f(z)是一个向量,维度和回归值y一样,将所有候选样本和目标样本依据相关性大小排序,选择最大的值作为目标在该帧图像中获得的最大响应值response,其相对应的候选目标被确定为跟踪结果;
D、依据前k帧的最大响应值,计算置信度阈值的初始阈值:
如果k<Len,则返回步骤二重新执行;其中,Len为计算置信度阈值的集合元素长度;
如果k=Len,依据获得的k个最大响应值,计算置信度阈值的初始阈值如下:
其中,median(·)表示对集合的元素取中间值;
如果k>Len,依据第k,k-1,k-2,k-3,k-4帧获得的最大响应值动态更新集合Rk={responsek,responsek-1…responsek-4},则第k帧的置信度阈值为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于郑州轻工业学院,未经郑州轻工业学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710531498.8/1.html,转载请声明来源钻瓜专利网。