[发明专利]一种基于深度学习的行人重识别与特征识别融合方法有效
申请号: | 201811501491.2 | 申请日: | 2018-12-10 |
公开(公告)号: | CN109711281B | 公开(公告)日: | 2023-05-02 |
发明(设计)人: | 冯辉;郝晓昱;李睿康;俞钧昊;胡波 | 申请(专利权)人: | 复旦大学 |
主分类号: | G06V40/10 | 分类号: | G06V40/10;G06V10/764;G06V10/80;G06V10/74;G06V10/82;G06N3/0464;G06N3/084 |
代理公司: | 上海正旦专利代理有限公司 31200 | 代理人: | 陆飞;陆尤 |
地址: | 200433 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 行人 识别 特征 融合 方法 | ||
本发明属于计算机视觉与人工智能技术领域,具体为一种基于深度学习的行人重识别与特征识别融合方法。本发明通过设计并训练一个神经网络,将行人重识别与特征识别相融合,自动判断两幅图像中的行人是否为同一个人,并且预测出图像中行人的多种特征;其中,所述的神经网络,以不同视角下的行人图像作为训练样本,以行人的编号以及行人特征作为训练标签,对网络进行训练;训练得到的网络,可以同时进行行人重识别与特征识别。对于输入两幅摄像头拍摄到的行人图像,可以自动判断是否为同一个人,同时会自动提取出行人的性别、年龄、衣着等12种特征。在公开数据集上的实验结果证明本发明方法的有效性。
技术领域
本发明属于计算机视觉与人工智能技术领域,具体涉及一种基于深度学习的行人重识别与特征识别融合方法。
背景技术
行人重识别与特征识别在侦查、监控与追踪方面具有很广泛的需求与应用。
行人重识别旨在匹配同一个行人在不同视角、不同光照、不同背景、不同姿态下的两幅图像,跨摄像头进行行人检索。早期行人重识别的算法主要基于手动设计(hand-crafted)的特征,如最显著的颜色信息,然而效果并不尽如人意。近年来随着深度学习(Deep Learning)的快速发展,使用卷积神经网络进行行人重识别取得了重大的进展。目前使用卷积神经网络的进行行人重识别工作的方法主要分为两类:深度度量学习和深度表征学习。度量学习(Metric Learning)是旨在设计一种度量方式使得不同类别的图像相似度远小于相同类别的图像,对应于神经网络中,即设计图像的距离函数和网络的代价函数,使得训练后的网络达到好的分类效果。具体到在行人重识别课题上,即找到一种度量方式使得同一行人的不同图像相似度大于不同行人的不同图像。基于表征学习(RepresentationLearning)的方法着眼于特征提取。随着卷积神经网络的快速发展,行人重识别课题的研究越来越来多地使用表征学习的方法。利用卷积神经网络能够根据实际需求自动从原始图像中提取出表征特征(Representation)的优势,部分研究以行人ID作为标签,将行人重识别问题作为对于行人ID的分类(Classification/Identification)问题来处理,或者转化为让网络来学习输入的两幅图像是否属于同一个行人的验证(Verification)问题。
行人特征识别也是安防监控方面一个极为重要的课题。在实际监控视频中获取可以进行人脸识别的人脸图像极为困难,但通过监控摄像头拍摄的图像识别出行人的衣着颜色、是否背包等特征,对于图像质量的要求远低于人脸识别,而识别出的行人特征,也对于目标具有很强的描述能力。在特征识别领域,目前较为流行的传统机器学习算法有支持向量机(SVM)和Haar特征上的AdaBoost分类器,但是传统机器学习算法仅能独立地训练每个特征分类器,当特征数量很大时,逐一训练将会非常繁琐。深度学习算法,特别是卷积神经网络(Convolutional neural network,CNN),已被证明在大规模分类问题上表现良好。CNN的成功启发了研究人员将其用于行人特征识别。同时,也有很多数据集被公开。
发明内容
本发明的目的在于提出一种基于深度学习的行人重识别与特征识别融合方法。
本发明提供的行人重识别与特征识别融合方法,基于深度学习的,即通过设计并训练一个神经网络,将行人重识别与特征识别相融合,自动判断两幅图像中的行人是否为同一个人,并且能够预测出图像中行人的多种特征;其中,所述的神经网络,以不同视角下的行人图像作为训练样本,以行人的编号以及行人特征作为训练标签,对网络进行训练;训练得到的网络,可以同时进行行人重识别与特征识别。
本发明提供的行人重识别与特征识别融合方法,具体包括:训练数据的选取,网络结构的设计,损失函数的设计,神经网络的训练,以及通过训练的神经网络,进行行人重识别与特征识别,并将二者融合,从而提高识别的精确度。
1、选取训练数据
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于复旦大学,未经复旦大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811501491.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于ST-Unet的视频异常检测方法
- 下一篇:光线调节方法及装置