[发明专利]一种融合多注意力机制的行人重识别方法在审

专利信息
申请号: 202110847407.8 申请日: 2021-07-27
公开(公告)号: CN113705348A 公开(公告)日: 2021-11-26
发明(设计)人: 佟剑瑞;薛峰;费吴俊 申请(专利权)人: 安徽中科有智科技有限公司
主分类号: G06K9/00 分类号: G06K9/00;G06K9/62;G06N3/04;G06N3/08
代理公司: 暂无信息 代理人: 暂无信息
地址: 230000 安徽省合肥市包河区花园大*** 国省代码: 安徽;34
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 融合 注意力 机制 行人 识别 方法
【说明书】:

发明公开了一种融合多注意力机制的行人重识别方法,包括:1、下载用于训练模型的数据集,并对数据集进行预处理;2、搭建融入多注意力机制的行人重识别网络,并选择合适的目标函数来优化模型参数;3、采用相应的评估指标来评价模型的效果;4、用训练好的模型对从视频中截取出的行人图片进行行人身份识别;本发明使用堆叠的多层卷积神经网络,并通过融合通道注意力机制和空间注意力机制来提取行人的细粒度特征,从而通过训练学习可以从行人图片中得到更加有效的高维特征,进而达到更加准确的行人重识别效果。

技术领域

本发明涉及计算机机器学习与人工智能技术领域,具体是一种融合多注意力机制的行人重识别方法。

背景技术

近年来,随着智能安防和视频监控领域的需求与日俱增,行人重识别研究受到了越来越广泛的关注和研究。行人重识别可以看成一个图片检索任务,它是利用计算机视觉技术判断给定的图片或视频序列中是否存在特定行人的技术,即给定一个行人图片,跨摄像头下检索出该行人。在视频监控中,由于摄像头分辨率低、光线强度不足、摄像角度不佳以及物体遮挡等因素,难以捕捉到行人清晰的人脸信息,因而难以通过人脸信息对行人身份进行辨别。在人脸信息缺失的情况下,行人重识别技术就发挥出了巨大的替代作用。行人重识别一大显著特征就是可以实现跨设备下的检索,即可以从多个不同的摄像头中检索出同一个行人。故而在如今高速发展的现代化社会中,出于智能安防和视频监控领域的迫切需要,行人重识别技术受到了越来越多的关注和研究,具有巨大的研究价值和实用价值。

早期,在深度学习技术普及之前,行人重识别研究主要是通过手工设计特征来进行的,这类方法的计算过程繁琐且最终的识别效果较差。近些年来,随着计算机硬件的快速发展和越来越多优秀的深度模型的提出,深度学习技术受到了越来越广泛的关注和发展。基于深度学习的行人识别技术也受到了众多学者的关注和研究,并取得了较大的进展和突破,其识别的准确度有了很大的提高。在基于深度学习的行人重识别方法中,按照所使用损失函数的不同,可以将其分为表征学习和度量学习两大类方法。表征学习方法旨在学习得到一个特征表示映射函数,通过将不同的行人映射到不同的高维特征空间从而对行人进行识别,通常使用分类损失函数或者验证损失函数来实现。度量学习方法旨在学习得到两张图片的相似度,即同一个行人的两张图片之间的距离很小,两个不同行人图片之间的距离很大,通常使用对比损失或者三元组损失函数来实现。相比于表征学习方法,度量学习方法通过深度神经网络直接学习得到行人图片之间的相似度,使得同一个行人的图片在高维特征空间分布更加紧凑,相应的,不同行人的图片在高维特征空间的分界面更加明晰。故而,使用度量学习方法来训练得到的模型的识别准确度较高,度量学习方法也成为了行人重识别领域的主流研究方法。

基于深度学习的行人重识别方法由于其强大的特征表示能力和识别准确性已经被广泛地应用于工业界视频监控和智能安防领域。然而目前这些方法主要是考虑整个行人图片的粗粒度特征,缺乏对行人细粒度特征的关注,如发型、衣服颜色、是否背包等。通过在深度模型中融入注意力机制,可以让模型关注到更多的局部细节信息,挖掘出关键的属性信息,从而获得更加有效的行人特征表示,进一步提高行人重识别的准确度。目前来看,融入注意力机制的行人重识别方法的研究较少,对行人细粒度的特征提取不够充分,行人重识别的准确率仍然较低,还有很大的改进空间。

发明内容

本发明的目的在于提供一种融合多注意力机制的行人重识别方法,以解决上述背景技术中提出的问题。

为实现上述目的,本发明提供如下技术方案:

一种融合多注意力机制的行人重识别方法,包括以下几个步骤进行:

步骤1、获取行人重识别数据集Market1501,并对数据集中的每张图片的大小进行归一化、随机裁剪和擦除数据增强,从而得到预处理后的图片集合,构成数据集L;

步骤2、将步骤1中得到的行人图片数据集L划分为训练集和测试集,并将训练集划分为多个批次,每个批次包含P个身份的行人,每个行人含有K张图片,即每个批次包含B(B= P×K)张行人图片作为训练样本;每个训练样本图片的通道个数为C、高度为H、宽度为W;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽中科有智科技有限公司,未经安徽中科有智科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110847407.8/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top