[发明专利]一种基于多通道注意力特征的行人重识别方法有效
申请号: | 201910355717.0 | 申请日: | 2019-04-29 |
公开(公告)号: | CN110110642B | 公开(公告)日: | 2020-12-22 |
发明(设计)人: | 周智恒;陈增群;李波 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 李斌 |
地址: | 510640 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 通道 注意力 特征 行人 识别 方法 | ||
本发明公开了一种基于多通道注意力特征的行人重识别方法,包括如下步骤:1)构建基于通道注意力的卷积神经网络模型,并预训练主干网络;2)提取行人图片在主干网络的输出特征,全局池化后计算特征的通道加权向量;3)加权向量与主干网络的输出特征相乘,再与其相加得到通道注意力特征;4)重复提取多个注意力特征,采用海林格距离进行特征多样性正则化;5)将注意力特征输入全连接层与分类器,训练最小化交叉熵损失和度量损失;6)将测试集图片输入训练好的模型提取特征,经度量排序实现行人重识别。本发明基于注意力机制提取行人的判别性特征,限制相似注意力特征的重复提取,有效地提高了行人重识别的准确率和鲁棒性。
技术领域
本发明涉及人工智能及计算机视觉技术领域,具体涉及一种基于多通道注意力特征的行人重识别方法。
背景技术
随着城市化进程的加快,社会公共安全需求日益增加,许多重要的公共场合都覆盖了广泛的摄像头网络,利用计算机视觉技术自动化监控成为关注的热点,行人重识别技术也逐渐成为研究的重点。一般来说,给定目标行人的图像或者视频片段,行人重识别用于检索跨摄像头视野下的目标行人。由于监控场景的复杂多变,采集的行人图像往往存在光照变化,视角姿势变化和遮挡等困难,给行人重识别带来巨大的挑战。
近年来,随着行人重识别的深入研究,行人局部特征提取成为研究的热点。由于行人躯干的刚体结构,一般采用水平切割行人特征图的方法进行局部特征提取。由于水平切分不能精确地定位高判别性的局部部位,导致准确率性能受限。此外,采用局部部位检测的方法需要额外的位置标签,额外的标签工作耗费人力物力,降低了方法的实用性。因此,目前亟待提出一种能够准确提取高判别性局部特征的行人重识别方法。
发明内容
本发明的目的是为了解决现有技术中的上述缺陷,提供一种基于多通道注意力特征的行人重识别方法。
本发明的目的可以通过采取如下技术方案达到:
一种基于多通道注意力特征的行人重识别方法,所述的人重识别方法包括如下步骤:
S1、构建基于通道注意力的卷积神经网络模型,并预训练主干网络;
S2、提取行人图片在主干网络的输出特征,全局池化后计算特征的通道加权向量;
S3、加权向量与主干网络的输出特征相乘,再与其相加,以残差的方式提取通道注意力特征;
S4、重复提取多个注意力特征,采用海林格距离进行特征多样性正则化;
S5、将注意力特征输入全连接层与分类器,训练最小化交叉熵损失和度量损失;
S6、将目标测试集图片输入训练好的模型提取特征,根据特征相似度进行排序得到行人重识别结果,进而实现行人重识别。
进一步地,所述的卷积神经网络模型中主干网络采用Resnet网络,将Resnet网络在ImageNet数据集上进行预训练,使Resnet网络获得理想的初始值。
进一步地,所述的步骤S2过程如下:
S2.1、定义主干网络的输出特征为U=[u1,…,uC]∈RW×H×C,通过全局池化聚合空间信息得到通道描述子z=[z1,…,zC]∈RC,全局池化表示为:
S2.2、基于通道描述子计算特征的通道加权向量,加权向量表示为:
其中p=1,…,P表示有多个通道注意力特征,为第一个全连接层的参数,为第二个全连接层的参数,r为降维比例常数,δ为ReLU函数,σ为Sigmoid函数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910355717.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种流域性洪涝场景的无人机监测方法及系统
- 下一篇:一种显示面板及显示装置