[发明专利]一种基于全局距离尺度损失函数的行人再识别方法有效
申请号: | 201910186858.4 | 申请日: | 2019-03-13 |
公开(公告)号: | CN109993070B | 公开(公告)日: | 2021-06-08 |
发明(设计)人: | 何颖;丁长兴;王侃 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06N3/08 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 李斌 |
地址: | 510640 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 全局 距离 尺度 损失 函数 行人 识别 方法 | ||
本发明公开了一种基于全局距离尺度损失函数的行人再识别方法,具体步骤包括:对行人再识别数据集的训练数据进行数据增强处理;对每一个批量数据进行随机挑选;构建基于人体组件的深度神经网络并对网络进行初始化;使用交叉熵损失函数和基于全局距离尺度的损失函数同时监督深度神经网络的训练;对目标行人图像及行人图像库中的行人图像分别进行特征提取,进行余弦相似度计算并排序得到识别结果。本发明提出了一种基于统计特性的全局距离尺度的损失函数,能够有效避免噪声干扰和降低过拟合的风险,提高模型鲁棒性和泛化能力。
技术领域
本发明涉及计算机视觉技术领域,尤其涉及一种基于全局距离尺度损失函数的行人再识别方法。
背景技术
随着深度学习的发展进步以及视频监控技术的日益普及,行人再识别技术因其能够在海量行人中搜寻到待查找行人的功能而变得越来越重要。
在行人再识别技术从传统的度量学习发展到更深更广的深度神经网络的学习的过程中,都离不开距离的度量。行人再识别技术能够在特征空间有效地拉近同类之间的距离并且增大异类之间的距离。而基于距离的度量,研究人员提出了诸多用于监督网络学习的损失函数,如基于二元组的Contrastive Loss和基于三元组的Triplet Loss以及在人脸识别中的Center Loss、COCO Loss、Range Loss和Marginal Loss。实践证明,上述损失函数在许多领域中都发挥了重要作用且得到了提高识别准确率的收益。
然而现有技术中基于距离尺度的损失函数都需要依靠类内或类间两两之间的度量关系,缺乏一种利用全局统计性质的考虑。
发明内容
本发明的目的在于克服现有技术的不足,提供一种基于全局距离尺度损失函数的行人再识别方法。本发明基于距离度量对深度神经网络学习的有效性,能够进一步提升行人再识别中的识别准确率。
本发明的目的能够通过以下技术方案实现:
一种基于全局距离尺度损失函数的行人再识别方法,具体步骤包括:
对行人再识别数据集的训练数据进行数据增强处理;
对每一个批量数据进行随机挑选;
构建基于人体组件的深度神经网络并对网络进行初始化;
使用交叉熵损失函数和基于全局距离尺度的损失函数同时监督深度神经网络的训练;
对目标行人图像及行人图像库中的行人图像分别进行特征提取,进行余弦相似度计算并排序得到识别结果。
具体地,所述对行人再识别数据集的训练数据进行数据增强处理的步骤中,数据增强处理方法为:
针对每一张行人图像,从图像中心区域随机选取一个点作为中心,截取到与原始图像同样大小的行人图像;重复上述步骤五次,即完成数据增强。
具体地,所述对每一个批量数据进行随机挑选的步骤中,挑选方法为:每一个批量中随机挑选P个人,每个人随机挑选K张图片,批量大小为N=P*K。
具体地,所述构建基于人体组件的深度神经网络并对网络进行初始化的步骤中,深度神经网络构建方法为:
在ResNet-50网络尾部的池化层将特征图水平划分为M个部分,各个部分分别连接包含U个神经元的全连接层、批量归一化层和包含Y个神经元的分类全连接层,共计M个子分类任务。
具体地,所述使用交叉熵损失函数和基于全局距离尺度的损失函数同时监督深度神经网络的训练的步骤中,
交叉熵损失函数表达式为:
其中,N为批量大小,i表示输入行人图像的编号,pi表示这张行人图片的真实标签,表示模型的分类概率结果;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910186858.4/2.html,转载请声明来源钻瓜专利网。