[发明专利]一种基于卷积神经网络的视觉跟踪方法在审
申请号: | 201710488018.4 | 申请日: | 2017-06-23 |
公开(公告)号: | CN107274437A | 公开(公告)日: | 2017-10-20 |
发明(设计)人: | 胡硕;赵银妹;孙翔 | 申请(专利权)人: | 燕山大学 |
主分类号: | G06T7/277 | 分类号: | G06T7/277;G06T7/246;G06K9/62 |
代理公司: | 秦皇岛一诚知识产权事务所(普通合伙)13116 | 代理人: | 李合印 |
地址: | 066004 河北省*** | 国省代码: | 河北;13 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 卷积 神经网络 视觉 跟踪 方法 | ||
1.一种基于卷积神经网络的视觉跟踪方法,其特征在于:该方法具体内容包括如下步骤:
步骤一,离线训练:利用CIFAR-10数据集对卷积神经网络进行离线训练,获得能够表达深度特征的能力;
步骤二,多特征融合:提取每层卷积层后的特征图,获得多种特征,进行多层特征融合;
步骤三,跟踪:在步骤一和步骤二的基础上使用粒子滤波方法完成跟踪。
2.根据权利要求1所述的一种基于卷积神经网络的视觉跟踪方法,其特征在于:在步骤一中,所述利用CIFAR-10数据集对卷积神经网络进行离线训练就是将CIFAR-10数据集输入卷积神经网络中,使用前向传递和误差反向传导的方法来训练网络获得深度特征,并对网络进行微调,其具体内容包括以下步骤:
(1)将输入数据集图片输入一个6层卷积神经网络中;
(2)在6层卷积神经网络中,其中前5层为卷积层,最后一层为全连接层,每层都得到若干个特征图;卷积核的大小设定为5*5;
(3)采用最大池化方法;
(4)前四层的激活函数选择ReLU函数,第五层后的激活函数选择Sigmoid函数。
3.根据权利要求1所述的一种基于卷积神经网络的视觉跟踪方法,其特征在于:在步骤二中,所述提取每层卷积层后的特征图,获得多种特征,进行多层特征融合,其内容包括以下两个步骤:
(1)由于提取的特征图维数较高,要对特征图进行降维处理,采用M2DPCA降维;
(2)对降维后的数据进行多特征融合。
4.根据权利要求3所述的一种基于卷积神经网络的视觉跟踪方法,其特征在于:所述采用M2DPCA降维就是在最大限度保留特征的同时进行降维处理;其具体步骤如下:
(1)将每一个卷积层后的每一幅特征图划分成m×n个子图像;
(2)直接计算子图像的图像协方差矩阵;
(3)从方差最大化的角度找出最优投影方向集{X1,X2,…,Xd};
(4)根据公式Wk=(A-Ai)Xk k=1,2…d求出投影向量Wk,即为得到的压缩向量,其中A为样本,Ai为样本均值;
(5)将各个模块压缩的子图像向量拼接在一起完成压缩过程。
5.根据权利要求3所述的一种基于卷积神经网络的视觉跟踪方法,其特征在于:所述对降维后的数据进行多特征融合,就是将卷积神经网络的各卷积层获得的深度特征进行多层特征融合;将每个卷积层后的特征图进行降维处理后根据公式(1)得到一个大的多维特征向量输入到SVM分类器中,进行目标与背景的分类;
其中M(i)为降维后的特征向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于燕山大学,未经燕山大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710488018.4/1.html,转载请声明来源钻瓜专利网。