[发明专利]一种基于卷积神经网络的视觉跟踪方法在审
申请号: | 201710488018.4 | 申请日: | 2017-06-23 |
公开(公告)号: | CN107274437A | 公开(公告)日: | 2017-10-20 |
发明(设计)人: | 胡硕;赵银妹;孙翔 | 申请(专利权)人: | 燕山大学 |
主分类号: | G06T7/277 | 分类号: | G06T7/277;G06T7/246;G06K9/62 |
代理公司: | 秦皇岛一诚知识产权事务所(普通合伙)13116 | 代理人: | 李合印 |
地址: | 066004 河北省*** | 国省代码: | 河北;13 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 卷积 神经网络 视觉 跟踪 方法 | ||
技术领域
本发明属于运动目标视觉跟踪技术领域,涉及一种基于卷积神经网络的视觉跟踪方法。
背景技术
随着社会的发展,视频监控起着越来越重要的作用,比如在军事领域、航空航天、人机交互、交通安全等方面,为了在交通领域更好的完成监控任务,采用计算机视觉的方法成为解决该问题的一个重要途径,而在跟踪过程中背景纷繁复杂,目会发生标被遮挡、形变以及光照变化等情况,使用通常的跟踪方法,特征描述能力难以满足跟踪过程中多种多样的复杂变化,从而导致跟踪器丢失目标。
因此人们迫切希望找到一种新的方法来解决在目标跟踪过程中的种种困难,随着深度学习的发展,卷积神经网络成了视觉领域一个无法替代的部分,利用卷积神经网络可以获取图像的结构性特征,这些特征相比之前的纹理、颜色等特征能更好的描述对象。比如中国专利申请号为201610579388.4“一种融合卷积神经网络的跟踪方法及系统”的专利申请中,通过预定的训练集对卷积神经网络进行预训练得到初步模型CNN1,接收用户输入的带有跟踪目标的视频流,通过微调技术对CNN1进行微调,得到CNN2,将最终模型CNN2替换TLD算法中的分类器,从而自动对监控视频流中的跟踪目标进行识别及跟踪。还有中国专利申请号为201610371378.1“基于深度卷积神经网络特征融合的目标跟踪方法及系统”的专利申请中,通过卷积神经网络获取多种特征,通过滤波器方法计算每种特征的滤波器权重,根据权重获取目标当前的跟踪目标位置,计算每种特征当前帧的预测精度损失,对每种特征,建立在时间t内的稳定模型,通过稳定模型计算每个特征在当前帧的稳定性,根据每种特征的稳定性及累计的预测精度损失,更新每种特征的权重,重复以上步骤完成跟踪。由此可见卷积神经网络已经在视觉跟踪领域发挥着很重要的作用。
本发明提出了一种基于卷积神经网络的视觉跟踪方法,与传统的卷积神经网络进行视觉跟踪不同的是,本发明采用从卷积神经网络每个卷积层后提取特征图,进行M2DPCA降维后,提取多层面的特征,多特征融合后输入到线性分类器中,再在粒子滤波的框架下进行跟踪,由于是提取多层面的特征,对特征的描述会更加准确,因此在很大程度上克服了跟踪过程中目标被遮挡和光照变化等难题,提高了特征的准确度,从而提高了跟踪精度。
发明内容
本发明的目的在于克服了现有技术中的不足,提供一种基于卷积神经网络的视觉跟踪方法,克服了跟踪过程中目标被遮挡和光照变化等难题,提高了特征的准确度,从而提高了跟踪精度。
为了解决上述存在的技术问题,本发明是通过以下技术方案实现的:
一种基于卷积神经网络的视觉跟踪方法,该方法具体内容包括如下步骤:
步骤一,离线训练:利用CIFAR-10数据集对卷积神经网络进行离线训练,获得能够表达深度特征的能力;
步骤二,多特征融合:提取每层卷积层后的特征图,获得多种特征,进行多层特征融合;
步骤三,跟踪:在步骤一和步骤二的基础上使用粒子滤波方法完成跟踪。
进一步的,在步骤一中,所述利用CIFAR-10数据集对卷积神经网络进行离线训练就是将CIFAR-10数据集输入卷积神经网络中,使用前向传递和误差反向传导的方法来训练网络获得深度特征,并对网络进行微调,其具体内容包括以下步骤:
(1)将输入数据集图片输入一个6层卷积神经网络中;
(2)在6层卷积神经网络中,其中前5层为卷积层,最后一层为全连接层,每层都得到若干个特征图;卷积核的大小设定为5*5;
(3)采用最大池化方法;
(4)前四层的激活函数选择ReLU函数,第五层后的激活函数选择Sigmoid函数。
进一步的,在步骤二中,所述提取每层卷积层后的特征图,获得多种特征,进行多层特征融合,其内容包括以下两个步骤:
(1)由于提取的特征图维数较高,要对特征图进行降维处理,采用M2DPCA降维;
(2)对降维后的数据进行多特征融合。
所述采用M2DPCA降维就是在最大限度保留特征的同时进行降维处理;其具体步骤如下:
(1)将每一个卷积层后的每一幅特征图划分成m×n个子图像;
(2)直接计算子图像的图像协方差矩阵;
(3)从方差最大化的角度找出最优投影方向集{X1,X2,…,Xd};
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于燕山大学,未经燕山大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710488018.4/2.html,转载请声明来源钻瓜专利网。