[发明专利]一种行人重识别方法及系统在审

申请号：	201711435514.X	申请日：	2017-12-26
公开（公告）号：	CN107977656A	公开（公告）日：	2018-05-01
发明（设计）人：	张史梁;田奇;高文;李佳宁	申请（专利权）人：	北京大学
主分类号：	G06K9/00	分类号：	G06K9/00;G06T3/00
代理公司：	北京辰权知识产权代理有限公司11619	代理人：	刘广达
地址：	100871***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种行人识别方法系统
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明涉及图像识别技术领域，尤其是涉及一种基于行人姿态归一化与时间金字塔池化的行人重识别方法及系统。

背景技术

近年来，随着人们对社会的公共安全越来越关注，视频监控系统大量普及。诸如机场、火车站、校园和办公大楼等公众场所，都亟需监控，为安防保驾护航。面对海量的监控视频数据，大量的人力需要投入到视频信息的监控与检索中去，这种方式的效率不仅低，还造成了额外资源浪费。如果能够利用计算机视觉分析技术，自动化监控及分析视频信息，必然可以极大地加快“平安城市”的建设。

行人重识别是计算机视觉的研究中关键的任务。一般来说，给定关于行人的一张图片或者一段视频，行人重识别就是在没有重叠区域的摄像头拍摄到的图片或者视频中，将同一个人识别出来的过程。尽管相关的研究越来越受到重视，行人重识别的准确率也已经提高了不少，但仍有许多困难需要解决。由于待识别的行人图片与原图片拍摄于不同的相机，设备的差异会给成像条件带来误差；不同的场景下的环境不一致，采集的数据也会产生不同的偏差；且光照的改变会使得同一种颜色的表现不同；更重要的是，行人在摄像头下的姿态变化以及遮挡问题，都使得对同一个人的辨别难度相当大。

近年来，由于深度学习的浪潮，卷积神经网络被广泛应用于行人重识别领域，通过深度网络提取图像特征，并且在相应的特征空间上使用深度学习或者传统方法进行距离度量，大大提高了行人重识别的准确率。这些工作的进展皆得益于深度卷积网络模型在特征提取上的能力，但在判别能力的探索上却局限于给定的特征空间，也因此限制了深度模型判别能力的提高。

发明内容

为解决以上问题，本发明提出了一种简单、高效地从视频序列中提取高判别力行人特征的方法。该特征可以用于行人身份对比，并应用于行人再识别系统中。

根据本发明的一个方面，提供了一种行人重识别方法，基于行人姿态归一化与时间金字塔池化，包括如下步骤：

接收视频图像序列，通过空间二维仿射变换完成所述视频图像序列的空间对齐；

提取经过二维仿射变换后所述视频图像序列内多个帧的全局特征；

使用时间金字塔池化算法，融合所述视频图像序列中多个帧的全局特征，以获得等长的序列级别的图像特征。

优选的，所述空间二维仿射变换包括按照空间变换网络的结构学习6个仿射变换参数。

优选的，所述空间变换网络包括三个组成部分：定位网络、参数化采样网格、可微分的图像采样器。

优选的，采用卷积神经网络提取所述全局特征。

优选的，所述视频图像序列不等长。

根据本发明的另一个方面，还提供了一种行人重识别系统，基于行人姿态归一化与时间金字塔池化，包括：

对齐模块，用于接收视频图像序列，通过空间二维仿射变换完成所述视频图像序列的空间对齐；