[发明专利]一种基于语义区域表达的行人重识别方法在审
申请号: | 201810930107.4 | 申请日: | 2018-08-15 |
公开(公告)号: | CN109344842A | 公开(公告)日: | 2019-02-15 |
发明(设计)人: | 雷建军;牛力杰;郑泽勋;彭勃;罗晓维;郭琰 | 申请(专利权)人: | 天津大学 |
主分类号: | G06K9/46 | 分类号: | G06K9/46;G06K9/62 |
代理公司: | 天津市北洋有限责任专利代理事务所 12201 | 代理人: | 李林娟 |
地址: | 300072*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 部件区域 集合 语义区域 描述符 图像 度量 矩阵 高层语义信息 特征描述符 颜色直方图 主成分分析 度量函数 获取部件 局部模式 局部特征 矩阵计算 区域特征 全局特征 特征空间 特征向量 图像背景 图像特征 位置检测 原始特征 可分性 鲁棒性 三元组 再使用 映射 级联 降维 样本 尺度 学习 | ||
本发明公开了一种基于语义区域表达的行人重识别方法,包括:给定一幅图像,将图像中行人不同部件的位置检测出来,得到包含不同部件区域的集合,根据行人所具备的高层语义信息,使用尺度不变局部模式描述符以及颜色直方图描述符,提取每一个部件区域内的特征并将其进行级联,再使用主成分分析对原始特征进行降维,获取部件区域特征的集合;根据部件区域特征的集合、结合图像的全局特征和局部特征获得对行人更完备的特征描述符;利用三元组损失训练度量函数,训练得到的度量矩阵可以将原始的特征向量映射到新的特征空间中,提高样本间的可分性;根据学习得到的度量矩阵计算行人图像特征之间的相似性,从而实现对行人的重识别。本发明不仅避免了图像背景的干扰,还实现了对应区域之间相似性的比较,有效提高特征的鲁棒性和可靠性。
技术领域
本发明涉及图像处理、计算机视觉技术领域,尤其涉及一种基于语义区域表达的行人重识别方法。
背景技术
随着智慧城市和公共安全需求的日益增长,智能视频监控系统得到了广泛的关注和研究,并已应用到安防、工业生产等诸多领域,在日常生活中扮演着重要的角色。在智能视频监控领域中主要关注的对象就是行人,最基本的任务就是在大范围的视频监控网络中对目标进行长期且稳定的跟踪。但是出于隐私以及维护成本等方面的考虑,摄像头监控网络很难覆盖整个区域,从而出现监控盲区,当目标经过监控盲区时,就无法对目标进行连续的跟踪,因此就会出现跟踪目标在一个摄像头的监控视野中消失,之后在其他摄像头中出现的情况。而把在一个监控摄像视野中丢失的目标在其他监控视野中重新找回的过程就是行人重识别技术。该技术通过解决非重叠摄像头视域的目标交接问题,从而将不同视域中的轨迹连接起来,实现在整个监控网络下对行人目标长期且稳定的跟踪。此外,行人重识别可以实现行人的检索功能,从历史录像中快速查找目标行人,代替人力排查的方式,高效快速的筛选出最有可能包含目标嫌疑人的视频图像。因此该技术具有广阔的应用前景和研究价值。
相比于其他已经取得高精度的生物识别系统,例如人脸识别来说,行人重识别的研究面临光照变化、视角变化、背景干扰、遮挡、图像质量低等诸多因素的干扰。例如,1)监控视频的画面较为模糊,另外也很难保证人脸是正对摄像机拍摄的,所以无法在监控视频中使用人脸识别技术,只能利用人体的外观信息来进行识别;2)由于视角、光照等因素的影响,同一个行人在不同场景下的外表会存在较大的差异,而不同行人的外表则有可能比较相似;3)遮挡与背景干扰等因素会导致目标身体的一部分不可见,仅靠可见部分难以对目标进行区分。这些因素都对行人重识别技术带来了很大的挑战,因此如何提取到可靠的特征表示,使其对这些因素具有较好的鲁棒性是解决该问题的一个关键步骤。结合图像中有用的语义区域表达特征,本发明提出了一种有效的特征提取方式,用于提高行人重识别算法的性能。
Liao等人将颜色直方图特征、尺寸不变纹理特征结合起来,用于提高特征的鲁棒性。Su等人利用高层的属性信息不随视角变化的特性来描述行人,以提高算法的准确度。Zhao等人在目标匹配过程中引入了显著性信息,Cheng等人提出了一个多流的卷积神经网络模型,同时学习目标的全局和局部信息。Wu等人将卷积神经网络的全连接层特征与传统的颜色特征相结合,以提高全连接层特征的辨析力。
发明人在实现本发明的过程中,发现现有技术主要存在以下缺点和不足:
现有技术的方法往往根据图像的全局特征进行目标相似性的比对,但未考虑全局特征中会包含背景信息等诸多干扰因素;现有方法通常计算图像对之间相同位置的相似性,再进行相似性的加和,没有考虑两幅图像中行人不对齐的问题。
发明内容
本发明提供了一种基于语义区域表达的行人重识别方法,本发明通过深入挖掘图像中具有语义信息的区域,设计了一种鲁棒的基于语义区域表达的行人重识别算法,用于提高算法检索的精度,详见下文描述:
一种基于语义区域表达的行人重识别方法,所述方法包括以下步骤:
给定一幅图像,将图像中行人不同部件的位置检测出来,得到包含不同部件区域的集合:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810930107.4/2.html,转载请声明来源钻瓜专利网。