[发明专利]一种深度哈希的行人再识别方法有效
申请号: | 201910311137.1 | 申请日: | 2019-04-18 |
公开(公告)号: | CN110046579B | 公开(公告)日: | 2023-04-07 |
发明(设计)人: | 张磊;刘方驿 | 申请(专利权)人: | 重庆大学 |
主分类号: | G06V40/10 | 分类号: | G06V40/10;G06V10/75;G06V10/774;G06V10/82;G06N3/0464;G06N3/0442;G06N3/08 |
代理公司: | 重庆大学专利中心 50201 | 代理人: | 唐开平 |
地址: | 400044 *** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 深度 行人 识别 方法 | ||
1.一种深度哈希的行人再识别方法,其特征是,包括以下步骤:
步骤1、构建深度神经网络
深度神经网包括特征学习模块和哈希学习模块,所述特征学习模块采用Resnet网络,行人图片通过特征学习得到2048位的特征;所述哈希学习模块为一个全连接层和一个tanh函数层;
步骤2、深度神经网络的训练
1)、数据的准备:准备行人图片,输入行人图片和对应的id标签,作为训练图片和测试图片;
2)、把训练图片送入深度神经网络进行训练
本步骤包括特征学习、哈希学习和损失函数学习;
所述特征学习为:将训练图片成批送入深度神经网络,特征学习的结果是输出2048维的全局特征;
所述哈希学习为:采用一个全连接层作为哈希学习函数,将2048维的全局特征映射为128位,然后使用激活函数tanh将128位的实值特征映射为区间[-1,1]内的模拟值;所述损失函数学习包括:三元哈希损失运算、量化损失运算和重构损失运算,三元哈希损失运算是让具有相同id的行人图片输出的哈希码的距离更近,让具有不同id的行人图片得到的哈希码的距离更远;量化损失运算是使学习到的哈希码更加接近严格的哈希码;重构损失运算是监督解码后得到的2048位特征与原始的全局特征相近,保持判别性;
所述三元哈希损失运算为:
Lossth=[H(h(f(xi)),h(f(xj)))-H(h(f(xi)),h(f(xk)))+α]+
式中,一个批次图片的三元组(xi,xj,xk),xi为参考样本,xj为与xi的id标签相同特征距离最大的难正样本,xk为与xi的id标签不同特征距离最小的难负样本,α为正负样本对间的间隔,f(xi),f(xj),f(xk)为样本对应的特征,h(.)=f2(f1())为哈希函数,[x]+=max(0,x),当三元哈希损失小于0时,损失为0;H(.)是汉明距离;
汉明距离松弛为:
H(x,y)=e-β·d(x,y)
式中,H(x,y)为指数距离,β是超参数,用于控制d(x,y)与H(x,y)间的关系,d(x,y)是欧式距离;
3)、网络优化及参数更新
更新包括前向传播和反向传播两部分,前向传播通过网络计算输出与损失大小,然后再反向传播过程中反传损失的梯度,从而对网络进行更新;
步骤3、深度神经网络的测试
将测试图片输入步骤1构建的深度神经网络,通过特征学习模块与哈希学习模块得到松弛的哈希码,然后通过符号函数转化为严格的-1,1码,计算query与gallery集中行人图片对应的哈希码间欧式距离进行特征匹配。
2.根据权利要求1所述的深度哈希的行人再识别方法,其特征是:在步骤2的数据准备中,训练图片的像素大小都设置为(384,128),一个批次的大小为128位,包含32个不同的id,每个id有4张图片。
3.根据权利要求2所述的深度哈希的行人再识别方法,其特征是:在步骤2中,所述量化损失运算为:
Lossqt=H(|h(f(x))|-1)
式中,h(f(x))为学习得到的哈希码,|.|为绝对值函数。
4.根据权利要求3所述的深度哈希的行人再识别方法,其特征是:在步骤2中,所述重构损失运算为:
Losscons=d(f(x),f2(h(f(x))))
式中,d(.)为欧式距离,f(x)为2048位全局特征,f2(h(f(x)))为解码后的2048位特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆大学,未经重庆大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910311137.1/1.html,转载请声明来源钻瓜专利网。