[发明专利]一种深度哈希的行人再识别方法有效
申请号: | 201910311137.1 | 申请日: | 2019-04-18 |
公开(公告)号: | CN110046579B | 公开(公告)日: | 2023-04-07 |
发明(设计)人: | 张磊;刘方驿 | 申请(专利权)人: | 重庆大学 |
主分类号: | G06V40/10 | 分类号: | G06V40/10;G06V10/75;G06V10/774;G06V10/82;G06N3/0464;G06N3/0442;G06N3/08 |
代理公司: | 重庆大学专利中心 50201 | 代理人: | 唐开平 |
地址: | 400044 *** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 深度 行人 识别 方法 | ||
本发明公开了一种深度哈希的行人再识别方法,它包括步骤:1、构建深度神经网络,该深度神经网包括特征学习模块和哈希学习模块,所述特征学习模块采用Resnet网络,所述哈希学习模块为一个全连接层和一个tanh函数层;2、深度神经网络的训练,1)、准备行人图片,2)、把训练图片送入深度神经网络进行训练,包括特征学习、哈希学习和损失函数学习;3)、网络优化及参数更新;步骤3、深度神经网络的测试,通过特征学习模块与哈希学习模块得到松弛的哈希码,然后通过符号函数转化为严格的‑1,1码,计算query与gallery中行人图片对应的哈希码间欧式距离进行特征匹配。本发明的优点是:提高了行人再识别准确率,又减少了行人再识别的时间。
技术领域
本发明属于行人再识别技术领域。
背景技术
行人再识别应用于行人追踪和刑侦搜索方面。在多摄像头监控系统,一个基本任务就是将不同时间、不同的地点的跨摄像头的行人联系起来,这就是行人再识别技术。具体来说,再识别就是根据在不同时间,分布于不同场景的摄像头得到的一系列数据对不同场景的单个或多个行人进行视觉匹配的过程。“行人再识别”主要目的是判断某个摄像头中的某个行人是否曾经出现在其他的摄像头中,即需要将某个行人特征与其他行人特征进行对比,判断是否属于同一个行人。
行人再识别主要存在的挑战有:行人姿态及摄像头视角的影响,行人背景杂乱及遮挡的影响,光照和图像分辨率的影响等。这些挑战对行人特征匹配造成了较大的困难,目前的识别方法是提取强健的具有判别性的特征。在实际监控过程中,无法捕捉到行人的脸部有效信息,通常使用行人的整体进行搜索。而在对行人的识别过程中,通常由于行人的姿态,光照,摄像头角度等多个因素的影响,可能使不同行人的特征比同一人的特征更为相似,对行人搜索造成了困难,学习更好的特征表达是一种比较有效的方式。
面对与日俱增的数据量、复杂度和精度,人工神经网络的规模也不断加深,用简单的表示来表达复杂表示。深度卷积网络就是一种监督学习下的深度学习模型,现有的许多行人再识别方法是基于提取行人特征,该行人特征是对行人图像的视角变化,光照影响,遮挡等问题具有较好的鲁棒性的特征,大幅提升了行人再识别的性能,其训练和测试的基本步骤如下:
1、准备数据,准备带对应标签的训练和测试数据;
2、把准备好的训练数据(包括图片及其对应的标签)送入深度卷积网络进行训练,训练时利用ADAM优化算法对深度卷积网络参数进行优化;
3、在深度卷积网络的损失收敛后,利用标准数据集的测试集对训练得到的深度卷积网络模型进行测试,测试标准参考标准数据集的评价方式,对网络模型的泛化能力进行评估。
目前测试方式主要基于度量,在gallery集中寻找与query集中图像匹配的图像。
哈希学习是将高维空间中的计算量大、复杂度高的高维数据,在尽可能保证其相似性的条件下,映射为简洁的二进制码便于进行计算;行人再识别中,由于摄像头视频数据的急剧增长,数据的特征表示和特征匹配计算量及复杂度也随之增长,计算和度量匹配就变得十分困难。大尺度的数据需要有效的计算和存储。
度量学习是学习一个合适的度量,现有的方法通常将行人再识别问题当作排序问题,通过构造二元组,三元组乃至四元组对样本间的关系进行度量,然后通过根据样本间关系构造损失学习度量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆大学,未经重庆大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910311137.1/2.html,转载请声明来源钻瓜专利网。