[发明专利]一种基于多尺度特征融合的行人重识别特征提取方法在审
申请号: | 202010785860.6 | 申请日: | 2020-08-07 |
公开(公告)号: | CN111985367A | 公开(公告)日: | 2020-11-24 |
发明(设计)人: | 王伟胜;黄蕾;颜志洋 | 申请(专利权)人: | 湖南大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 410082 湖*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 尺度 特征 融合 行人 识别 提取 方法 | ||
1.一种基于多尺度特征融合的行人重识别特征提取方法,其特征在于实施步骤为:
(1)对数据集进行预处理,预处理包括:旋转、ToTensor、遮挡、对比度、翻转、锐化增强、噪声、滤波、倾斜、图像色彩空间转换、图片叠加与融合、颜色抖动、gamma变换、图片混合;
(2)构建多尺度特征融合网络;
(3)分Batch向网络输入图像,在多尺度特征融合网络中提取特征、融合特征图和降维,前向传播输出预测值;根据预测值和真实值计算Softmax和Triplet损失并反向传播更新模型参数,迭代训练直到满足结束训练的条件。
2.根据权利要求1所述的基于多尺度特征融合的行人重识别特征提取方法,其特征在于本方法对数据集和图像的预处理为:
(1)训练数据中图像的命名格式为行人ID_摄像头ID视频ID_视频帧数_检测框;
(2)数据集包括训练集、查询集和查询库;
(3)数据集进行resize,对图像进行处理包括:旋转、ToTensor、遮挡、对比度、翻转、锐化增强、噪声、滤波、倾斜、图像色彩空间转换、图片叠加与融合、颜色抖动、gamma变换、图片混合。
3.根据权利要求1所述的基于多尺度特征融合的行人重识别特征提取方法,其特征在于本方法在构建多尺度特征融合网络的设计为:
(1)以ResNet为backbone,在其基础上进行修改;
(2)将backbone的layer3层提取的特征作为共享特征,其后接两个分支,分别为Global分支和Part分支;
(3)Part分支将ResNet最后一层的stride由2降为1,使特征图的大小和layer3提取的特征图大小一致,该分支提取到的特征记为layer4.4(Part);Global分支使用原ResNet的layer4层的操作,该分支提取到的特征记为layer4.4(Global);Part分支和Global分支行人图像特征图大小分别为(8,4)和(16,8),在两个分支的特征图上使用全局平均值池化;
(4)抽取layer3.1和layer4.1的特征图,其大小分别为(16,8)和(8,4);
(5)通过分别将Part分支和Global分支与layer3.1和layer4.1的特征图进行融合,分别标记为layer3.1_p和layer4.1_g;
(6)将以上4个特征向量(layer4.4(Part)、layer4.4(Global)、layer3.1_p、layer4.1_g)降维成512的特征,进行特征融合,组成2048维的特征进行相似性度量。
4.根据权利要求1所属述的一种基于多尺度特征融合的行人重识别特征提取方法,其特征在于本方法在构建多尺度特征融合网络、对数据预处理后:
(1)分Batch向网络中输入训练图像,在多尺度特征融合网络中提取特征、融合特征图和降维,将特征进行前向传播输出预测值;
(2)根据输出的预测值与真实值计算Softmax和Triplet损失,反向传播更新模型参数,迭代训练直到满足结束训练的条件。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖南大学,未经湖南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010785860.6/1.html,转载请声明来源钻瓜专利网。