[发明专利]一种深度哈希的行人再识别方法有效

申请号：	201910311137.1	申请日：	2019-04-18
公开（公告）号：	CN110046579B	公开（公告）日：	2023-04-07
发明（设计）人：	张磊;刘方驿	申请（专利权）人：	重庆大学
主分类号：	G06V40/10	分类号：	G06V40/10;G06V10/75;G06V10/774;G06V10/82;G06N3/0464;G06N3/0442;G06N3/08
代理公司：	重庆大学专利中心 50201	代理人：	唐开平
地址：	400044 ***	国省代码：	重庆;50
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种深度行人识别方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种深度哈希的行人再识别方法，其特征是，包括以下步骤：

步骤1、构建深度神经网络

深度神经网包括特征学习模块和哈希学习模块，所述特征学习模块采用Resnet网络，行人图片通过特征学习得到2048位的特征；所述哈希学习模块为一个全连接层和一个tanh函数层；

步骤2、深度神经网络的训练

1)、数据的准备：准备行人图片，输入行人图片和对应的id标签，作为训练图片和测试图片；

2)、把训练图片送入深度神经网络进行训练

本步骤包括特征学习、哈希学习和损失函数学习；

所述特征学习为：将训练图片成批送入深度神经网络，特征学习的结果是输出2048维的全局特征；

所述哈希学习为：采用一个全连接层作为哈希学习函数，将2048维的全局特征映射为128位，然后使用激活函数tanh将128位的实值特征映射为区间[-1，1]内的模拟值；所述损失函数学习包括：三元哈希损失运算、量化损失运算和重构损失运算，三元哈希损失运算是让具有相同id的行人图片输出的哈希码的距离更近，让具有不同id的行人图片得到的哈希码的距离更远；量化损失运算是使学习到的哈希码更加接近严格的哈希码；重构损失运算是监督解码后得到的2048位特征与原始的全局特征相近，保持判别性；

所述三元哈希损失运算为：

Loss_th＝[H(h(f(x_i))，h(f(x_j)))-H(h(f(x_i))，h(f(x_k)))+α]₊

式中，一个批次图片的三元组(x_i，x_j，x_k)，x_i为参考样本，x_j为与x_i的id标签相同特征距离最大的难正样本，x_k为与x_i的id标签不同特征距离最小的难负样本，α为正负样本对间的间隔，f(x_i)，f(x_j)，f(x_k)为样本对应的特征，h(.)＝f₂(f₁())为哈希函数，[x]₊＝max(0，x)，当三元哈希损失小于0时，损失为0；H(.)是汉明距离；