[发明专利]一种基于标签不确定性和人体组件模型的行人再识别方法有效
申请号: | 201910072934.9 | 申请日: | 2019-01-25 |
公开(公告)号: | CN109829414B | 公开(公告)日: | 2020-11-24 |
发明(设计)人: | 何颖;丁长兴;王侃 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/46;G06K9/62 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 李斌 |
地址: | 510640 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 标签 不确定性 人体 组件 模型 行人 识别 方法 | ||
1.一种基于标签不确定性和人体组件模型的行人再识别方法,其特征在于,具体步骤包括:
(1)构建基于人体组件的深度神经网络模型;
(2)对构建的深度神经网络模型进行初始化,并根据构建的深度神经网络结构训练得到另一个深度神经网络模型;
所述步骤(2)中,训练后得到的另一个深度神经网络模型用于提取稠密型向量,提取方法为:各自从一个已训练好的深度神经网络模型的P个对应组件的分类层中提取,得到P个稠密型向量;
(3)对初始化后的深度神经网络模型进行训练并更新网络中的参数;
所述步骤(3)包括:
(3-1)采用softmax函数对得到的稠密型向量进行归一化处理,再与行人图像原始one-hot标签进行线性组合后作为待训练模型图像的输入标签;
(3-2)针对不同的局部组件,设置不同权重;
所述步骤(3-2)中权重设置为:偏重于行人图像中间局部组件损失的计算,将靠上和靠下的局部组件损失计算的权重逐渐减小;
(3-3)针对每一个样本设置阈值,对于损失值小于样本阈值的样本,忽略其对损失函数的贡献,即将损失设置为零;
(3-4)采用随机梯度下降法对局部组件的包含sigmoid函数的交叉熵损失函数的加权和求最优解,从而进行深度神经网络参数的更新;
(4)采用训练好的深度神经网络对目标行人图像及行人图像库中的行人图像分别进行特征提取;
(5)对提取得到的特征进行余弦相似度计算并排序,得到识别结果。
2.根据权利要求1所述的一种基于标签不确定性和人体组件模型的行人再识别方法,其特征在于,所述步骤(1)中,以ResNet-50网络为基础结构进行修改调整,构建基于人体组件的P个分类任务的深度神经网络模型。
3.根据权利要求2所述的一种基于标签不确定性和人体组件模型的行人再识别方法,其特征在于,所述深度神经网络构建方法为:在ResNet-50网络中剔除掉输出维度为1000的全连接层,将layer4中降采样率stride=2修改为stride=1;在池化层后划分为P个部分,每个部分均包含N个神经元的全连接层、批量归一化层和Dropout层,最后接上分类全连接层。
4.根据权利要求1所述的一种基于标签不确定性和人体组件模型的行人再识别方法,其特征在于,所述步骤(2)中,采用在行人再识别的常用数据集Market-1501中预训练后的分类模型的参数对构建的深度神经网络模型进行初始化。
5.根据权利要求1所述的一种基于标签不确定性和人体组件模型的行人再识别方法,其特征在于,所述步骤(3-1)中的线性组合公式为:
其中,表示得到的稠密型向量,表示行人图像的原始one-hot标签,alpha表示超参数。
6.根据权利要求1所述的一种基于标签不确定性和人体组件模型的行人再识别方法,其特征在于,采用随机梯度下降法计算时,包含sigmoid函数的交叉熵损失函数的表达式为:
其中,K表示一个批量中输入行人图像的个数,i表示输入行人图像的编号,yi表示第i张行人图像的输入标签,xi表示通过深度神经网络分类的概率结果,σ表示sigmoid函数。
7.根据权利要求1所述的一种基于标签不确定性和人体组件模型的行人再识别方法,其特征在于,所述步骤(4)中特征提取过程为:将目标行人图像及行人图像库中的行人图像输入训练后得到的深度神经网络中,各自在P个部分中选择输出维度为2048的全连接层,分别提取该层的特征向量,并将每部分的特征进行拼接,形成最终的特征向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910072934.9/1.html,转载请声明来源钻瓜专利网。