[发明专利]一种基于多层神经网络的跨场景行人重识别的方法在审
申请号: | 201811010519.2 | 申请日: | 2018-08-31 |
公开(公告)号: | CN109117823A | 公开(公告)日: | 2019-01-01 |
发明(设计)人: | 顾晓清;倪彤光;王洪元 | 申请(专利权)人: | 常州大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/46;G06K9/62 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 213164 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于多层神经网络的跨场景行人重识别的方法,其步骤如下:(1)采集当前场景下摄像头中的行人视频,截取视频帧;(2)对步骤1截取到的视频帧中的行人图像进行特征提取和降维处理,使用样本对构成目标域训练集Xt,得到测试集Xo;(3)对相关场景下的带标识数据进行处理,使用样本对构成源域训练集Xs;(4)建立训练集X,X=[Xs,Xt];(5)使用X来训练多层神经网络模型;(6)根据步骤5得到的模型在测试集Xo中对待识别样本进行识别。本发明选用具备可实现复杂非线性映射的多层神经网络作为学习模型,使用迁移学习思想将相关场景的带标识数据加入到新场景的模型学习中,使得对新场景的学习更准确有效。 | ||
搜索关键词: | 场景 多层神经网络 训练集 样本 标识数据 测试集 视频帧 截取 非线性映射 摄像头 降维处理 模型学习 特征提取 目标域 学习 源域 迁移 视频 采集 图像 | ||
【主权项】:
1.一种基于多层神经网络的跨场景行人重识别的方法,其特征在于,包括以下步骤:步骤1.采集当前场景下摄像头中的行人视频,截取视频帧;步骤2.对步骤1截取到的视频帧中的行人图像进行特征提取和降维处理,得到当前场景下带标识的目标域训练数据和不带标识的目标域测试集xti和xoi分别是目标域训练样本和目标域测试样本,yti是xti的标识,Nt和N0分别是目标域训练样本和测试样本的数量,根据样本的标识,将具有相同标识的训练样本组成正样本对,不同标识的训练样本组成负样本对,样本对构成目标域训练集Xt;步骤3.使用步骤2所述的特征提取和降维方法对相关场景下的带标识数据进行处理,根据样本的标识,将具有相同标识的训练样本组成正样本对,不同标识的训练样本组成负样本对,样本对构成源域训练集Xs,xsi是源域训练样本,ysi是xsi的标识,Ns是源域训练样本的数量;步骤4.建立训练集X,X=[Xs,Xt];步骤5.使用训练集X来训练多层神经网络模型;步骤6.根据步骤5得到的多层神经网络模型在目标域测试集Xo中对待行人重识别的样本z进行行人重识别;其中,上述步骤2所述的对步骤1截取到的视频帧中的行人图像进行特征提取和降维处理,其特征在于:首先将待提取特征的图像进行归一化处理,图像分块为像素大小,图像的每一小块在水平和垂直方向的区域块重叠率为50%;然后对于分块后的图像进行特征提取,主要提取RGB、YCbCr和HS颜色特征共8个颜色通道,建立16bin的直方图,以及提取HOG和LBP特征并建立直方图;对于每个行人图像共有75个分块,根据特征提取的内容,每个块中有484维的特征向量;再采用主成分分析方法对行人图像的高维特征进行降维处理;上述步骤5所述的使用训练集X来训练多层神经网络模型,其特征在于,所述多层神经网络由输入层、多个隐含层和输出层组成,其中第一层是输入层,第二层到第M层是隐含层,最后一层即第M+1层是输出层,层与层之间是全连接,前一层的任意一个神经元与后一层的任意一个神经元相连;所述建立使用训练集X来训练多层神经网络模型包含以下步骤:步骤5.1.初始化第1层到第M层的权重矩阵和偏置向量其中b(m)初始化为0向量,W(m)中的每个分量服从均匀分布,其中表示W(m)的第i行第j列个元素,当m=1时,n的值等于神经网络第一层上的神经元数,当m=2,...,M时,n的值等于神经网络第m‑1层上的神经元数;步骤5.2.所述多层神经网络的第一层接受输入数据集,即训练集X;步骤5.3.每一次迭代,通过下式计算得到所述多层神经网络第一层的输出h(1):其中是非线性激活函数,可以是tanh或者sigmoid函数,x表示X中的任意样本;步骤5.4.将h(1)作为隐含层的输入,隐含层逐层前向传播,每个层将前一层的输出作为本层的输入,通过下式计算得到所述多层神经网络的第m层的输出其中第M层的输出记为f(x):步骤5.5.根据步骤5.4得到的f(x),建立源域和目标域的跨场景相似性度量SMCS(similarity measure for cross scenario):其中||·||2表示2‑范数运算,式(5)的第一项为目标域所有行人样本f(x)的均值,第二项是源域中正样本对的行人样本的f(x)的均值,第三项是源域中负样本对的行人样本的f(x)的均值,正样本对的行人样本标识为行人数为Ns+,负样本对的行人样本标识为行人数为Ns‑Ns+;步骤5.6.在所述多层神经网络的输出层建立多层神经网络模型的最优化函数J:其中g()是Logistic损失函数α和β都是正常数,源域Xs和目标域Xt训练集中的样本对(xi,xj)参与式(6)的第一项的计算,i和j分别表示样本的标号,如果样本对(xi,xj)是正样本对,则lij=1,如果样本对(xi,xj)是负样本对,则使用下式定义lij:其中函数τ是一个正常数,||·||F表示F‑范数运算;采用梯度下降法求解式(6)中的和其中λ是学习率,对式(6)求导,得到和具体的计算式如下,按照从输出层到输入层的方向调整W(m)和b(m)的值,其中T表示矩阵的转置运算,当m=1,2,...,M‑1时,和具体的计算式如下:当m=M时,和具体的计算式如下:其中Θ表示点积运算,c、和可用下式计算,步骤5.7.根据步骤5.6得到的的值计算式(6)的值,记为Jk,其中k表示当前迭代的次数,计算与上一次迭代得到的最优化函数Jk‑1的差值,判断|Jk‑Jk‑1|是否小于ε或者k的值是否大于最大迭代次数,若不是,则转向步骤5.3;若是,则当前和为模型最优解,至此模型训练完毕,转向步骤6;上述步骤6所述的根据步骤5得到多层神经网络模型在目标域测试集Xo中对待行人重识别的样本z进行行人重识别,其特征在于:将待行人重识别样本z和数据集Xo中的每个待匹配图像的样本代入步骤5得到多层神经网络模型,计算的值,其中xoi∈Xo,如果的值小于阈值τ,则确定所述目标行人图像中的目标行人和所述测试集中的待匹配行人为同一个行人,如果的值大于阈值τ,则确定所述目标行人图像中的目标行人和所述测试集中的待匹配行人不是同一个行人。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于常州大学,未经常州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811010519.2/,转载请声明来源钻瓜专利网。