[发明专利]一种基于多尺度邻接交互特征的行人重识别方法有效
申请号: | 202210526758.3 | 申请日: | 2022-05-13 |
公开(公告)号: | CN114973317B | 公开(公告)日: | 2023-04-28 |
发明(设计)人: | 产思贤;戚梦赞;吴周检 | 申请(专利权)人: | 杭州像素元科技有限公司 |
主分类号: | G06V40/10 | 分类号: | G06V40/10;G06V10/82;G06V10/80;G06V10/764;G06V10/46;G06V10/44;G06V10/42;G06N3/045;G06N3/08 |
代理公司: | 北京奥肯律师事务所 11881 | 代理人: | 王娜 |
地址: | 310000 浙江省杭州市滨江区长河街道建业*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 尺度 邻接 交互 特征 行人 识别 方法 | ||
本发明公开了一种基于多尺度邻接交互特征的行人重识别方法,它涉及图像识别技术领域。获取采集的视频文件,裁剪目标图像,配对同一目标,将ResNet50作为主干网络,获取初始多尺度特征;将目标特征从第三层开始依次使用SOA;将各层的目标特征输入到Bottleneck提取局部信息,对齐空间大小;将特征图输入到Transformer网络,得到全局特征;将局部特征和全局特征按照特征维度联合,并将联合特征切片,经同尺度特征交互和跨尺度特征交互操作得目标的多尺度邻接特征表示,最后通过损失函数训练得到行人重识别模型。本发明提高行人重识别的鲁棒性,有效抑制目标被密集地划分而导致得语义信息模糊和背景干扰问题。
技术领域
本发明涉及的是图像识别技术领域,具体涉及一种基于多尺度邻接交互特征的行人重识别方法。
背景技术
行人重识别(Personre-identification,简称Re-ID)也称行人再识别,是利用计算机视觉技术判断图像或者视频序列中是否存在特定行人的技术,被广泛认为是一个图像检索的子问题。给定一个监控行人图像,检索跨设备下的该行人图像。旨在弥补目前固定的摄像头的视觉局限,并可与行人检测和行人跟踪技术相结合,可广泛应用于智能视频监控、智能安保等领域。在监控视频中,由于相机分辨率和拍摄角度的缘故,通常无法得到质量非常高的人脸图片。当人脸识别失效的情况下,Re-ID就成为了一个非常重要的替代品技术。在尺度变换、遮挡和换装等复杂情况下,重识别精度会大幅降低。如何提高行人重识别的鲁棒性,仍存在一些挑战。
深度学习方法中,根据训练损失函数的不同可以分为基于表征学习的方法和基于度量学习的方法。根据方法原理不同,可以将近几年行人重识别的研究分为区域、注意力、姿势和生成对抗性网络四类方法。当前效果最为先进的当选基于切片的行人重识别,能够提取细粒度信息。为了符合人体结构特征,切片方式通常将图片或特征图水平等分割。考虑到切片会产生信息损失,部分研究将部分特征和全局特征整合,同时学习局部切片特征和全局特征,动态对齐局部信息。然而过度的切片会造成目标被密集的划分,从而引发目标语义信息模糊以及抗背景干扰能力下降。
为了解决上述的目标语义信息模糊以及抗背景干扰能力下降的问题,开发一种基于多尺度邻接交互特征的行人重识别方法尤为必要。
发明内容
针对现有技术上存在的不足,本发明目的是在于提供一种基于多尺度邻接交互特征的行人重识别方法,能够有效抑制目标被密集地划分而导致得语义信息模糊和背景干扰问题,提高行人重识别的鲁棒性,易于推广使用。
为了实现上述目的,本发明是通过如下的技术方案来实现:一种基于多尺度邻接交互特征的行人重识别方法,其步骤为:
(1)获取采集的视频文件,将其中包含人的目标图像裁剪出来,将不同摄像头的同一目标配对;考虑到ResNet50的强大特征表示,将ResNet50作为主干网络,同一目标的多张图片输入主干网络来获取初始多尺度特征;
(2)将主干网络生成的第三层、第四层和第五层目标特征提取作为多尺度特征的基础,从第三层开始依次使用SOA,利用上下文信息来提高感受野的同时达到同一尺度内特征聚合的效果;
(3)将第三层、第四层和第五层的目标特征分别输入到Bottleneck提取局部信息同时增强特征表示能力,利用最大池化方式对齐空间大小;
(4)将得到空间对齐后的特征沿着空间通道进行连接到的聚合后的特征图输入到Transformer网络,得到全局特征;
(5)将步骤(2)中得到的基于CNN的局部特征和步骤(4)得到基于Transformer的全局特征按照特征维度联合起来;
(6)将上述步骤得到的联合特征进行切片,然后经过同尺度特征交互和跨尺度特征交互这两种特征交互操作,得到目标的多尺度邻接特征表示;
(7)最后通过损失函数训练得到基于多尺度邻接交互特征的行人重识别模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州像素元科技有限公司,未经杭州像素元科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210526758.3/2.html,转载请声明来源钻瓜专利网。