[发明专利]一种行人重识别方法及系统在审
申请号: | 201711435514.X | 申请日: | 2017-12-26 |
公开(公告)号: | CN107977656A | 公开(公告)日: | 2018-05-01 |
发明(设计)人: | 张史梁;田奇;高文;李佳宁 | 申请(专利权)人: | 北京大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06T3/00 |
代理公司: | 北京辰权知识产权代理有限公司11619 | 代理人: | 刘广达 |
地址: | 100871*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 行人 识别 方法 系统 | ||
技术领域
本发明涉及图像识别技术领域,尤其是涉及一种基于行人姿态归一化与时间金字塔池化的行人重识别方法及系统。
背景技术
近年来,随着人们对社会的公共安全越来越关注,视频监控系统大量普及。诸如机场、火车站、校园和办公大楼等公众场所,都亟需监控,为安防保驾护航。面对海量的监控视频数据,大量的人力需要投入到视频信息的监控与检索中去,这种方式的效率不仅低,还造成了额外资源浪费。如果能够利用计算机视觉分析技术,自动化监控及分析视频信息,必然可以极大地加快“平安城市”的建设。
行人重识别是计算机视觉的研究中关键的任务。一般来说,给定关于行人的一张图片或者一段视频,行人重识别就是在没有重叠区域的摄像头拍摄到的图片或者视频中,将同一个人识别出来的过程。尽管相关的研究越来越受到重视,行人重识别的准确率也已经提高了不少,但仍有许多困难需要解决。由于待识别的行人图片与原图片拍摄于不同的相机,设备的差异会给成像条件带来误差;不同的场景下的环境不一致,采集的数据也会产生不同的偏差;且光照的改变会使得同一种颜色的表现不同;更重要的是,行人在摄像头下的姿态变化以及遮挡问题,都使得对同一个人的辨别难度相当大。
近年来,由于深度学习的浪潮,卷积神经网络被广泛应用于行人重识别领域,通过深度网络提取图像特征,并且在相应的特征空间上使用深度学习或者传统方法进行距离度量,大大提高了行人重识别的准确率。这些工作的进展皆得益于深度卷积网络模型在特征提取上的能力,但在判别能力的探索上却局限于给定的特征空间,也因此限制了深度模型判别能力的提高。
发明内容
为解决以上问题,本发明提出了一种简单、高效地从视频序列中提取高判别力行人特征的方法。该特征可以用于行人身份对比,并应用于行人再识别系统中。
根据本发明的一个方面,提供了一种行人重识别方法,基于行人姿态归一化与时间金字塔池化,包括如下步骤:
接收视频图像序列,通过空间二维仿射变换完成所述视频图像序列的空间对齐;
提取经过二维仿射变换后所述视频图像序列内多个帧的全局特征;
使用时间金字塔池化算法,融合所述视频图像序列中多个帧的全局特征,以获得等长的序列级别的图像特征。
优选的,所述空间二维仿射变换包括按照空间变换网络的结构学习6个仿射变换参数。
优选的,所述空间变换网络包括三个组成部分:定位网络、参数化采样网格、可微分的图像采样器。
优选的,采用卷积神经网络提取所述全局特征。
优选的,所述视频图像序列不等长。
根据本发明的另一个方面,还提供了一种行人重识别系统,基于行人姿态归一化与时间金字塔池化,包括:
对齐模块,用于接收视频图像序列,通过空间二维仿射变换完成所述视频图像序列的空间对齐;
特征提取模块,用于提取经过二维仿射变换后所述视频图像序列内多个帧的全局特征;
特征融合模块,用于使用时间金字塔池化算法,融合所述视频图像序列中多个帧的全局特征,以获得等长的序列级别的图像特征。
与传统方法相比,在多个基于视频的行人再识别数据集上,本发明的识别准确率超过了多个最新的方法,且具有更低的算法复杂度。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1为本发明基于行人姿态归一化与时间金字塔池化的行人重识别方法的流程图;
图2为本发明时间金字塔池化方法(L=3,d=1024)示意图。
图3为本发明行人重识别系统的结构图。
具体实施方式
下面将参照附图更详细地描述本发明的示例性实施方式。虽然附图中显示了本发明的示例性实施方式,然而应当理解,可以以各种形式实现本发明而不应被这里阐述的实施方式所限制。相反,提供这些实施方式是为了能够更透彻地理解本发明,并且能够将本发明的范围完整的传达给本领域的技术人员。
本发明使用空间对齐的时间金字塔池化(spatial aligned temporal pyramid pooling,SATPP)网络,有效并易于重复视频图像特征学习基础方法。本发明提出空间对齐的时间金字塔池化基于以下两点考虑:处理不整齐的行人包围盒;提取并融合后续视频图像中的区别性特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京大学,未经北京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711435514.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:利用行人占据区域实现密度统计的方法及系统
- 下一篇:远程监护方法、终端及系统