[发明专利]基于深度学习和距离度量学习的人员再识别方法在审
申请号: | 201810157658.1 | 申请日: | 2018-02-24 |
公开(公告)号: | CN108345860A | 公开(公告)日: | 2018-07-31 |
发明(设计)人: | 李弼程;赵永威;朱彩英;陈良浩 | 申请(专利权)人: | 江苏测联空间大数据应用研究中心有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/08 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 215000 江苏省苏州市高*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 距离度量 学习 视觉词典 图像 卷积神经网络 误差反向传播 行人目标检测 对视频数据 准确度 语义 本质属性 度量空间 视频图像 图像表达 线性SVM 分类器 稀疏性 选择行 最优化 向量 微调 视频 监督 分组 检测 网络 | ||
本发明涉及识别方法领域,尤其是基于深度学习和距离度量学习的人员再识别方法。该识别方法包括:(1)采用基于卷积神经网络的行人目标检测方对视频数据进行处理,检测出视频中的行人目标;(2)利用非监督RBM网络采用自底向上的方式对行人目标的初始特征进行编码得到兼具稀疏性和选择行的视觉词典;(3)利用误差反向传播对初始视觉词典进行有监督微调,获取视频图像新的图像表达方式,也即是图像深度学习表示向量;(4)采用特征分组与特征值最优化的距离度量学习方法,获取更加接近真实语义的度量空间,并采用线性SVM分类器对行人目标进行识别。本发明能够更加准确的表达图像本质属性,从而很好地提升行人再识别准确度。
技术领域
本发明涉及识别方法领域,尤其是基于深度学习和距离度量学习的人员再 识别方法。
背景技术
近年来,随着视频监控系统大量建设与应用,使其在打击犯罪、维护稳定 实践中发挥着越来越重要的作用。当前大多数监控系统采用实时拍摄和人工监 视的形式,这要求监控人员时刻注意监控画面,仔细分辨视频中的事件,而这 显然是不现实的,何况人工查看的方式存在大量的疏漏和主观误差。考虑到日 益增长的监控视频规模,这种方式所需的人力成本也将难以承受,而且效率低 下。因此,急需方便快捷的方法来替代现有的人工主导的监控体系。强烈的现 实需求和计算机相关技术的进步,催生了行人再识别技术(Person Re-identification),该技术也成为了当前视频智能监控领域中一个极具有挑战性的问题,其主要任务是完成跨摄像头的行人搜索与识别。行人再识别技术 主要是通过视觉比对的方式将视场不重叠的多个摄像机所拍摄到的属于同一个 行人的图像或者视频片段关联起来的技术。
特征提取是人员再识别技术的核心步骤,特征的好坏直接影响着识别结果 的准确与否,因此,需要我们研究如何提取能够准确表达人体结构性信息的特 征。深度学习的兴起和发展为图像特征表达提供了新的技术手段,但存在着解 释性差、模型复杂度高、计算强度高等问题。而视觉词袋模型则能够有效地进 行中层语义建模,将图像底层特征映射至视觉单词上,建立了跨越“语义鸿沟” 的桥梁,那么如何将深度学习网络强大的自学习能力用于生成兼具稀疏性和选 择性的视觉词典,同时对深度学习网络进行优化是本发明解决的一个关键问题。
在完成行人图像特征提取之后,需要使用训练好的分类器或者距离度量完 成跨摄像机的图片相似度匹配,对查询图像进行身份判定。然而,现有的相似 性度量模型的泛化能力不强,另一个问题就是研究一种区分性更好的度量空间, 使特征空间和语义空间相一致,进一步提升行人再识别的性能。
发明内容
本发明要解决的技术问题是:为了解决现有的现有的相似性度量模型的泛 化能力不强,且行人再识别性能差的不足,本发明提供了一种基于深度学习和 距离度量学习的人员再识别方法,通过深度学习和距离度量学习,较好地提高 了视觉词典的稀疏性和选择性,提取的特征能够更加准确的表达图像本质属性, 从而很好地提升行人再识别准确度。
本发明解决其技术问题所采用的技术方案是:
一种基于深度学习和距离度量学习的人员再识别方法,包括以下步骤:
(1)采用基于卷积神经网络的行人目标检测方对视频数据进行处理,检测 出视频中的行人目标;
(2)利用非监督RBM网络采用自底向上的方式对行人目标的初始特征进行 编码得到兼具稀疏性和选择行的视觉词典;
(3)利用误差反向传播对初始视觉词典进行有监督微调,获取视频图像新 的图像表达方式,也即是图像深度学习表示向量;
(4)采用特征分组与特征值最优化的距离度量学习方法,获取更加接近真 实语义的度量空间,并采用线性SVM分类器对行人目标进行识别。
具体地,所述采用基于卷积神经网络的行人目标检测方法,分为模型训练 阶段和目标检测阶段:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江苏测联空间大数据应用研究中心有限公司,未经江苏测联空间大数据应用研究中心有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810157658.1/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序