[发明专利]一种视觉追踪优化方法有效
申请号: | 201910034645.X | 申请日: | 2019-01-15 |
公开(公告)号: | CN109886996B | 公开(公告)日: | 2023-06-06 |
发明(设计)人: | 刘星星;沈波 | 申请(专利权)人: | 东华大学 |
主分类号: | G06T7/246 | 分类号: | G06T7/246;G06N3/0464 |
代理公司: | 上海申汇专利代理有限公司 31001 | 代理人: | 翁若莹;柏子雵 |
地址: | 201600 上*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 视觉 追踪 优化 方法 | ||
本发明涉及一种视觉追踪优化方法,本发明采用初始模板保留了目标的原始信息,逐帧更新的模板获取了目标的实时信息,将两个模板估计的位置进行加权融合,可以得到最佳的目标位置。目标丢失因子的提出使得在追踪失败情况下不会对逐帧更新模板造成损坏,当追踪目标重新出现在搜索区域时,使用逐帧更新模板仍然能够产生较大的响应值,进而准确的确定目标位置。
技术领域
本发明涉及一种相关滤波追踪方法,属于深度学习视觉追踪技术领域。
背景技术
视觉目标追踪技术是计算机视觉的一个重要组成部分,涉及到众多的研究领域,如图像处理、人机交互等。而我们通常认为的计算机视觉,可以称为是一门教会计算机(或其他图像设备)如何“看”的学科,或者说是研究如何从复杂的场景和图像数据中感知设备所处环境的学科。其中涉及到目标的识别及识别后的持续跟踪、目标行为理解和说明、摄像头采集的图像进行数据融合及图像处理等。
推动视觉技术发展的最主要的原因是现今监控摄像头、手机等电子设备的高度普及,照片及视频的数据量(或者称样本量)急剧增加,而且这些都是与人们的生产与生活活动密切相关的方面。面对数量如此巨大的图片和视频内容,急需学者们理解这些内容并在其中找出运动的模式,来揭示那些我们忽略的细节,挖掘其中的隐藏价值。
发明内容
本发明的目的是:提高视觉追踪的精度和速度。
为了达到上述目的,本发明的技术方案是提供了一种视觉追踪优化方法,其特征在于,包括以下步骤:
步骤1、获取当前帧的追踪图片;
步骤2、对追踪图片进行预处理后,圈定感兴趣区域;
步骤3、使用VGG-Net网络提取感兴趣区域的深度卷积特征,记为X,X∈RP×Q×D,式中,R表示特征空间,P、Q、D分别表示特征空间的宽度、高度和维数;
步骤4、若当前帧为初始帧,则使用相关滤波算法将从VGG-Net网络中提取到的深度卷积特征X进行训练得到滤波器后,得到滤波器的初始模板,将下一帧作为当前帧,返回步骤1,否则进入步骤5;
步骤5、获得当前帧的滤波器更新模板,其中,滤波器模板的更新公式为:
式中,表示算法学习到的滤波器,算法第t帧学习到的滤波器定义为Y为高斯标签矩阵,Y∈RP×Q,高斯标签矩阵Y中元素大小服从以目标尺寸中心为峰值位置,标准差大小与目标尺寸成正比的二维高斯分布,表示离散傅里叶变换;表示的第d个维度,λ表示一个正则化参数,λ≥0;表示更新后的第t帧追踪图片所对应的滤波器模板;η表示更新速率;表示第t-1帧追踪图片所对应的滤波器模板;⊙表示哈达马积;
步骤6、将滤波器的初始模板和当前帧的深度卷积特征进行点乘得到相关滤波响应矩阵一,相关滤波响应矩阵一最大响应值为估计得到的追踪目标位置一;
将滤波器更新模板和当前帧的深度卷积特征进行点乘得到相关滤波响应矩阵二,相关滤波响应矩阵二最大响应值为估计得到的追踪目标位置二;
步骤7、对追踪目标位置一及追踪目标位置二加权融合得到最终目标位置,将下一帧作为当前帧,返回步骤1。
优选地,步骤2中的所述预处理包括以下步骤:
读入追踪图片的目标尺寸和目标位置坐标,圈定感兴趣区域。
优选地,步骤3中,提取深度卷积特征包括以下步骤:
首先将追踪图片输入到VGG-Net的数据输入层,经过卷积计算层,Relu激励层,池化层,全连接层,最终通过输出层输出所述深度卷积特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东华大学,未经东华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910034645.X/2.html,转载请声明来源钻瓜专利网。