[发明专利]基于自适应特征聚类和多重损失融合的行人重识别方法在审
申请号: | 201910205489.9 | 申请日: | 2019-03-18 |
公开(公告)号: | CN109919246A | 公开(公告)日: | 2019-06-21 |
发明(设计)人: | 韩红;陈军如;岳欣;张照宇;李阳;高鑫磊 | 申请(专利权)人: | 西安电子科技大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/00 |
代理公司: | 陕西电子工业专利中心 61205 | 代理人: | 田文英;王品华 |
地址: | 710071*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 特征聚类 自适应 测试数据集 训练数据集 残差 网络 高层特征 数据增强 损失函数 网络学习 语义性 融合 准确率 构建 载入 中层 测试 | ||
1.一种基于多尺度特征学习和特征分割的行人重识别方法,其特征在于,利用所构建的多尺度特征学习网络提取行人图像多尺度特征,利用所构建的特征分割模块提取不同尺度下全局特征和粗细两种不同粒度的局部特征;该方法的具体步骤包括如下:
(1)构建多尺度特征学习模块:
(1a)搭建一个11层的多尺度特征学习模块,其结构依次为:输入层→卷积层→最大池化层→八个沙漏模块;所述沙漏模块的结构为十个串联的残差块,其中第一个残差块的输出与第十个残差块的输入相连接,第二个残差块的输出与第九个残差块的输入相连接,第三个残差块的输出与第八个残差块的输入相连接,第四个残差块的输出与第七个残差块的输入相连接;
(1b)设置多尺度特征学习模块各模块参数;
(2)构建特征分割模块:
(2a)搭建八个4层的特征分割模块,其结构依次为:特征分割层→全局池化融合层→全卷积层→SoftMax分类层;
(2b)设置特征分割模块各层参数如下:将池化融合层输出的特征映射图设置为1792个,将全卷积层的输出特征映射图设置为256个;
(3)构建特征学习网络:
将多尺度特征学习模块中的每个沙漏模块输出与每个特征分割模块输入一对一连接,将每个沙漏模块中的第七、八、九、十共四个残差块输出与每个特征分割模块输入四对一连接;
(4)对包含行人的视频进行预处理:
(4a)从摄像头拍摄的视频图像中,各提取一段连续的包含多人行人的视频图像,从每幅视频图像中选取一帧图像,从每帧视频图像中裁取出每个行人所占区域的图像,将所有裁取的图像组成行人图像集合A,将行人图像集合A中的行人图像大小统一设置为384×124像素;
(4b)将行人图像集合A中同一行人的所有图像,标注为同一类行人图像的真实标签,每一类至少包含一幅行人图像,将带有真实标签的所有行人图像组成行人图像训练集;
(4c)从摄像头拍摄的视频图像中,各提取一段连续的包含多人行人的视频图像,从每幅视频图像中选取一帧图像,从每帧视频图像中裁取出每个行人所占区域的图像,将所有裁取的图像组成行人图像集合B,将行人图像集合B中的行人图像大小统一设置为384×124像素;
(4d)从行人图像集合B中任意选取一幅行人图像,作为查询目标行人图像,将行人图像集合B中其余的行人图像作为候选行人图像集;
(5)训练特征学习网络:
(5a)将行人图像训练集输入到特征学习网络,将第八个特征分割模块SoftMax分类层输出的概率分布,作为每个行人图像的预测概率分布,将预测概率分别中最大值所属类别作为行人图像的预测标签;
(5b)使用标签平滑的交叉熵公式,计算行人图像训练集中每个行人图像的预测标签与该行人图像对应真实标签的交叉熵,将所有交叉熵之和作为特征学习网络的损失值;
(5c)使用随机梯度下降法,训练特征学习网络;
(6)计算特征距离:
(6a)将查询目标行人图像和候选行人图像集中每个行人图像输入到特征学习网络,将特征学习网络中第八个特征分割模块全卷积层输出的特征映射图,作为每个行人图像特征;
(6b)利用欧氏距离公式,计算查询目标行人图像特征与候选行人集中每个行人图像特征的特征距离;
(7)获得匹配图像:
将候选行人集中的行人图像按照特征距离的大小升序排序,将前20幅图像作为行人重识别的匹配图像。
2.根据权利要求1所述的基于多尺度特征学习和特征分割的行人重识别方法,其特征在于,步骤(1a)中所述残差块为九层,其结构依次为:第一个批标准化层→第一个ReLU层→第一个卷积层→第二个批标准化层→第二个ReLU层→第二个卷积层→第三个批标准化层→第三个ReLU层→第三个卷积层,第一个批标准化层与第三个卷积层相连接后作为残差块的输出;将残差块中第一个卷积层的特征映射图设置为64个,卷积核大小设置为3×3个像素,步长设置为1个像素,将残差块中第二个卷积层的特征映射图设置为256个,卷积核大小设置为1×1个像素,步长设置为1个像素,将残差块中第三个卷积层的特征映射图设置为256个,卷积核大小设置为3×3个像素,步长设置为1个像素。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910205489.9/1.html,转载请声明来源钻瓜专利网。