[发明专利]一种基于层级优化度量学习的行人再识别方法有效
申请号: | 201910869949.8 | 申请日: | 2019-09-16 |
公开(公告)号: | CN110717402B | 公开(公告)日: | 2022-08-05 |
发明(设计)人: | 肖江文;黄正义;王燕舞 | 申请(专利权)人: | 华中科技大学 |
主分类号: | G06V40/10 | 分类号: | G06V40/10;G06N3/04;G06N3/08 |
代理公司: | 华中科技大学专利中心 42201 | 代理人: | 李智;曹葆青 |
地址: | 430074 湖北*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 层级 优化 度量 学习 行人 识别 方法 | ||
本发明公开了一种基于层级优化度量学习的行人再识别方法,属于行人再识别领域。本发明提出层次优化策略,利用批量梯度下降法优化深度神经网络参数,通过数学上的转换实现映射矩阵凸优化。分级优化模式能够有效的实现深度度量学习与传统度量学习优势互补,进而提升算法性能,提升了行人识别的性能。提出构建强样本约束,即只利用距离最远的同标签样本与距离最近的异标签样本来构建样本约束,有效减少样本约束的数量,保证每个样本约束的有效性,实现模型快速优化。提出新正则项,通过对参数向量求余弦值来衡量参数向量的差异性,给出的正则形式为参数向量的内积与其范数归一损失的求和,能够在训练过程中避免参数趋同,提高多样性。
技术领域
本发明属于行人再识别领域,更具体地,涉及一种基于层级优化度量学习的行人再识别方法。
背景技术
在生活中,许多场景都安装有大量的摄像头,这些视频采集设备能够产生海量数据。行人再识别技术就是利用海量的视觉信息来分析行人的特征。行人再识别技术有着广阔的应用,能够用于行人追踪、行人的年龄识别、行人行为判断等。近些年来,行人再识别技术得到了快速发展,其中,基于度量学习的行人再识别技术是较为主流的方法。
度量学习的本质可以简单地描述为:有监督地学习一个映射机制,用该机制把样本映射到一个新的嵌入空间中;在这个嵌入空间中,需要满足样本约束条件:具有相同标签样本间的距离小于不同标签样本间的距离。这个完整的度量学习具有三个部分:映射样本,构建样本约束,计算损失并更新参数。度量学习的发展可以划分两个阶段:传统度量学习阶段和深度度量学习阶段。传统度量学习的建模过程可以描述为:利用一个半正定的马氏矩阵定义马氏距离,并通过把问题转化成凸优化问题求得该矩阵最优解。深度度量学习的建模过程比较简单,主要是利用深度神经网络的很强表达能力和强非线性映射能力来实习度量学习的目标。
传统度量学习和深度度量学习仅仅在损失函数是相同的,在其它面却存在很大的差异性。从结构上分析,传统度量学习属于单层矩阵的模型,因此在优化方面,它具有深度度量学习所不具备的优势,比如,算法收敛性有保障,优化的参数少,数学背景容易解释,约束条件容易转换。但是,传统的网络模型在训练过程中,参数向量(或参数矩阵)容易趋同,使得网络陷入局部最优,并最终影响模型的性能。与传统度量学习相比,具有多层结构的深度度量学习的优化算法主要有梯度下降法以及其改进优化算法,性能效果总体上优于传统度量学习。但是,无论传统的度量学习还是深度度量学习,构建模型的三元样本约束集都会产生很大时间开销。此外,现有的基于度量学习的行人再识别技术,只能单独使用反向传播技术来优化深度模型或者利用数学转换来确保浅层模型凸优化。
发明内容
针对现有技术的缺陷和改进需求,本发明提供了一种基于层级优化度量学习的行人再识别方法,其目的在于实现深度神经网络与传统度量学习有机地结合,改进了构建三元样本约束的策略,提出了一个新的正则项和一种分级式的优化策略,可以有效地改善样本的分布和实现数据降维。
为实现上述目的,按照本发明的一个方面,提供了一种基于层级优化度量学习的行人再识别方法,所述方法包括以下步骤:
S1.选择训练样本集,初始化嵌入空间的维度Dime、反向传播算法的学习率η和迭代次数Niter;
S2.使用训练样本集预训深度神经网络,根据训练好的深度神经网络参数初始化去掉损失层的深度神经网络权重参数W,利用随机数初始化映射矩阵L;
S3.选取部分训练样本,在当前的W和L下,把该批样本映射到维度为Dime的嵌入空间;
S4.在嵌入空间中构建三元样本约束,得到三元样本约束集;
S5.遍历全部三元样本约束集,利用最大边际最近邻法更新映射矩阵L;
S6.固定更新后的映射矩阵L,利用反向传播算法更新网络参数W;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中科技大学,未经华中科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910869949.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:年龄估计方法及装置、设备、存储介质
- 下一篇:一种人脸多目标跟踪方法