[发明专利]一种基于多粒度信息交互模型的行人重识别方法有效
申请号: | 202010495916.4 | 申请日: | 2020-06-03 |
公开(公告)号: | CN111709331B | 公开(公告)日: | 2023-06-09 |
发明(设计)人: | 孔军;刘旭东;蒋敏;谈天 | 申请(专利权)人: | 江南大学 |
主分类号: | G06V40/10 | 分类号: | G06V40/10;G06V10/82;G06V10/778;G06V10/80;G06V10/42;G06N3/0464;G06N3/08;G06N3/084 |
代理公司: | 大连理工大学专利中心 21200 | 代理人: | 梅洪玉;刘秋彤 |
地址: | 214122 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 粒度 信息 交互 模型 行人 识别 方法 | ||
一种基于多粒度信息交互模型的行人重识别方法,属于机器视觉领域。该方法采用多粒度网络通过空间分块的方式在保留输入图片特征图的同时将该特征图分为多个尺度的子特征图,并且将原特征图作为全局分支处理,将每个子特征图作为局部分支处理。此外提出了多粒度信息交互模型来促进多个分支之间的信息交互。多粒度信息交互模型包含全局映射注意力模块和标签项互学习模块。全局映射注意力模块负责促进全局分支与局部分支之间的信息交互,标签项互学习模块负责促进多个全局分支之间的信息交互。最终利用多粒度信息交互模型分别促进了全局分支与局部分支以及不同全局分支之间的信息交互,进一步提高了具有多分支网络结构的行人重识别模型的性能。
技术领域
本发明属于机器视觉领域,特别涉及一种基于多粒度信息交互模型的行人重识别方法。
背景技术
行人重识别也称行人再识别,是利用计算机视觉技术判断图像或者视频序列中是否存在特定行人的技术。行人重识别具有广泛的应用,例如多种场景的行人跟踪和视频监控。虽然行人重识别领域已经取得了很大的进展,但它仍然面临着来自背景遮挡、摄像机视角不同、光照和人体姿态变化大的挑战。
行人重识别分为基于图像的行人重识别与基于视频的行人重识别。如果数据集的数据单位均为图片,则属于基于图片的行人重识别任务,如果数据集的数据单位为视频,则属于基于视频的行人重识别任务。本发明是针对基于图片的行人重识别任务提出的。
近年来所提出的行人重识别方法大多数通过设计包含全局分支与局部分支的多分支卷积神经网络来获取行人图片的深度特征。但是这种只考虑多分支的网络结构存在以下问题:(1)有些行人图片不具有准确的边框,导致部分局部分支工作在无效的特征图上;(2)各个分支之间没有任何信息交互,导致无法互相补充有效信息。
基于上述问题,本发明提出了一种基于多粒度信息交互模型的行人重识别方法(Interactive Information Module based Person Re-identification,IIM-ReID)。其中IIM模型包含全局映射注意力模块Global-map Attention Module(GAM)和标签项互学习模块Label-Class Mutual Learning(LML)。GAM采用与多粒度网络Multiple GranularityNetwork(MGN)[G.Wang,Y.Yuan,X.Chen,J.Li,X.Zhou,Learning discriminativefeatureswith multiple granularities for person re-identification,in:2018ACMMultimedia Conference on Multimedia Conference,ACM,2018,pp.274–282.]类似的多全局分支与多局部分支的网络结构,设计GAM的目的是为了完成全局分支与局部分支间的信息交互。LML则是基于Deep Mutual Learning(DML)[Y.Zhang,T.Xiang,T.M.Hospedales,H.Lu,Deep mutual learning,in:Proceedings of the IEEE Conference on ComputerVision and PatternRecognition,2018,pp.4320–4328.]中的散度损失策略提出的,设计LML的目的是为了促进不同全局分支间的相互学习。
发明内容
本发明的主要目的是提出一种基于多粒度信息交互模型的行人重识别方法IIM-ReID,通过多粒度信息交互模型IIM促进了多个分支间的信息交互,增强了多个分支间信息的互补性,以进行高效的行人重识别。
为了实现上述目的,本发明提供如下技术方案:
一种基于多粒度信息交互模型的行人重识别方法,步骤如下:
步骤一、读取图片并使用Resnet-50作为特征提取层提取特征图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江南大学,未经江南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010495916.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:小体量河湖淤泥集约式处理系统及处理工艺
- 下一篇:一种多制式集成通信系统
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置