[发明专利]一种基于局部特征关系融合的行人重识别方法在审
申请号: | 202011397694.9 | 申请日: | 2020-12-04 |
公开(公告)号: | CN112560604A | 公开(公告)日: | 2021-03-26 |
发明(设计)人: | 朱佳辉;夏利民 | 申请(专利权)人: | 中南大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/32;G06K9/62;G06N3/04 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 410083 湖南*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 局部 特征 关系 融合 行人 识别 方法 | ||
本发明公开了一种基于局部特征关系融合的行人重识别方法,行人重识别作为视频监控中的热门领域,可以在仅有单张行人照片的情况下在图像库中检索不同视角,姿态,光照条件下的该行人其余图片,随着天网等智能监控工程的推进,行人重识别将会发挥越来越重要的作用。本发明提出了一种基于局部特征关系融合的行人重识别方法,使用CNN的局部感受野在原始图片中寻找行人的身体部位并进行区域上的聚类,随后对所提取的局部特征和全局特征在注意力机制的帮助下进行最终的关系融合以获得行人特征表示。在Market1501数据集上的实验表明了本发明的有效性和简便性。
技术领域
本发明涉及视频监控领域,首次将局部特征关系应用于视频监控中的人员检测。
背景技术
行人重识别的主要目的是在图像库中自动地寻找符合给定行人身份的行人图片。对于视频监控而言,行人重识别技术能帮助我们在不同的摄像头中自动的寻找对应的行人,而避免监控人员的大量人工操作,可以大大提升效率。采用行人重识别技术,只需要给定特定行人的完整身体部位,即可以在摄像头所拍摄的图像库中寻找该行人的其他照片,因此可以加快寻找速度,减少人工操作。
发明内容
本发明的目的是为了解决在视频监控中寻找给定行人时,人工方法费时费力的问题。
本发明采用以下的技术方案实现的:
一种基于局部特征关系融合的行人重识别方法,其特征在于包含以下步骤:
(1)使用改进版的ResNet-50网络对输入图片提取原始特征图;
(2)使用K-Means聚类算法来对兴趣点进行空间聚类;
(3)对聚类后的区域提取局部特征和全局特征;
(4)使用注意力算法对局部特征进行融合;
(5)使用多阶段训练方法对整体模型进行训练。
前述基于局部特征关系的行人重识别方法,其特征在于通过区域聚类和特征融合方式获得行人的自重特征表示。
S1前述基于局部特征关系的行人重识别方法,其特征在于使用改进版的ResNet-50网络对输入图片提取原始特征图的具体算法是:
1、本方法使用ResNet-50网络结构的变体作为基线网络的特征提取部分。相较于原始网络,在第3个layer处进行了通道维数的修改,将通道变为1024维,此外在第四个layer后的全连接层也被修改为全局平均池化层。
2、将图片送入本方法所改进的ResNet变体网络中,并在第三个layer处进行截断,此时网络的输出即是所提取的原始特征图。
S2前述基于局部特征关系的行人重识别方法,其特征在于使用K-Means聚类算法来对兴趣点进行空间聚类的具体算法是:
1、传统寻找空间兴趣点的方法多为角点检测等,然而此类方法多受困于背景噪声的困扰。本专利为了排除背景噪声的干扰,使用了更为巧妙的深度学习方法。其思想在于:卷积神经网络的局部感受野提取图片的低级特征,对行人重识别而言,其行人区域显然是神经神经网络中最关注的地方,这可以表现为特征图中的激活度也相对较高。提取激活度高的区域大概率将归属于行人区域,对于少量的背景噪声,虽然其可能在某一个通道表现出了较高的激活度,但由于其只占据了图中的少部分内容,因此可以使用连通域来对其进行判断和排除。对于S1所获得的特征图,在每个通道中提取其激活度最高的兴趣点的空间坐标。
2、对所有的特征图进行如上操作后,取得了1024个兴趣点的空间坐标,首先检测其在空间上的连通度,将与主体分离的孤立点予以剔除,进而获得图像的主体部位。处理完毕后的特征点将会使用K-Means聚类算法进行聚类。聚类完毕后将得到p个类,取其坐标的外接矩形,并认为该外接矩形即是我们提取的局部区域。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中南大学,未经中南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011397694.9/2.html,转载请声明来源钻瓜专利网。