[发明专利]一种基于半监督学习的提高行人重识别聚类精度的方法在审
申请号: | 202211526656.8 | 申请日: | 2022-11-30 |
公开(公告)号: | CN115965992A | 公开(公告)日: | 2023-04-14 |
发明(设计)人: | 刘峥琦;杜博;林雨恬 | 申请(专利权)人: | 武汉大学 |
主分类号: | G06V40/10 | 分类号: | G06V40/10;G06V20/52;G06V20/40;G06V10/762;G06V10/774;G06V10/82 |
代理公司: | 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 | 代理人: | 严彦 |
地址: | 430072 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 监督 学习 提高 行人 识别 精度 方法 | ||
本发明公开了一种基于半监督学习的提高行人重识别聚类精度的方法。该方法利用已有的少量标注样本指导所有样本的聚类,提高了聚类的可靠性;弥补了基础聚类策略的不足,针对不同类型的聚类错误,进行合并或分裂操作,显著提高了聚类精度;同时考虑了不同相机所造成的影响,使行人重识别网络模型学习更多关于行人的有效特征;具有适应度高、性能高、需要标注信息少、简易优化聚类的特点,可以有效应用于需要快速部署行人重识别系统的实际安防场景。
技术领域
本发明属于行人重识别技术领域,具体涉及一种基于半监督学习的提高行人重识别聚类精度的方法。
背景技术
行人重识别是计算机视觉中的重要研究领域,广泛应用于大型公共场所的安保监控,例如在游乐园中找人,监控可疑分子的行动轨迹等。行人重识别任务的目标是从多个重叠摄像头采集的图像集或者视频片段中识别出目标行人。在实际的监控视频中,由于相机分辨率、光照、拍摄距离和角度等一系列因素的影响,通常获取不到质量很高的人脸图片,因此造成人脸识别技术的失效,这种情况下行人重识别就发挥了重要的作用。由于已存在成熟的行人检测工具,行人重识别任务被广泛认为是图像检索问题,即按给定的图像去检索图像数据集中所有特定行人的图像。
在深度学习中,有监督学习是模型表现较佳的训练方式。但是标注数据非常耗时耗力,例如在行人重识别任务中人工去分辨不同摄像头下的同一个行人的成本是非常高的,所以完全有监督学习在实际场景中并不能应用。为了解决这一问题,越来越多的研究者开始关注半监督学习,旨在研究通过较弱的监督信号训练神经网络。半监督可以分为三种类型:不完全监督、不确切监督和不准确监督,现有的方法多针对于不完全监督设定。不完全监督的训练数据只有部分数据是带有正确标签的,其他大部分数据是没有经历标注过程的。针对这类半监督数据,现有的方法主要分为两类:利用已标注样本约束网络学习;对所有样本进行聚类获得伪标签。
利用已标注样本约束网络学习通常是关注于跨摄像头这一重要特性,例如保证当前样本与最难分辨的正样本距离小于与最容易认错的负样本距离。除此之外,通过不同摄像头所拍摄图像的特征分布预测当前样本在其他摄像头下的图像,以及利用GAN网络生成行人在所有摄像头下的有标签图像也是主流的仅利用标签数据的方法。但这类方法过于依赖有标签样本的数量,并且学习到的特征很有限。对所有样本进行聚类获得伪标签的方法在行人重识别领域中应用十分广泛。模型通过使用聚类算法将特征相似的图像聚集在一起,并获得聚类标签即网络学习时的伪标签。显而易见,聚类的准确性对训练模型来说是非常重要的,现有方法多是通过要求聚类的独立性和紧凑性来筛选可靠的聚类。这类方法虽然能有效地避免大部分噪声影响,但也带来了一些缺点,例如离散值过多、放弃学习不同摄像头下相似度不够的同一行人的样本等。总的来说,在半监督的行人重识别任务中,如何利用有限的完全正确标注信息去提高训练样本聚类质量是值得深入研究的。
发明内容
针对现有技术不足,本发明提供一种基于半监督学习的提高行人重识别聚类精度的方法。该方法利用已有的少量标注样本指导所有样本的聚类,从而提高聚类的可靠性;在指导聚类过程中,通过重聚类,具体为分裂和合并原聚类操作来获得更可靠的小聚类;同时考虑了不同相机所造成的影响,使模型学习更多关于行人的有效特征。
为了达到上述目的,本发明提供的技术方案是一种基于半监督学习的提高行人重识别聚类精度的方法,包括以下步骤:
步骤1,获取行人重识别数据集,将其分为训练集和测试集,并对训练集中少量数据进行人工标注,得到有标签的训练数据集;
步骤2,利用DBSCAN聚类算法对步骤1中所有训练集数据进行聚类,并获得样本数据的伪标签;
步骤3,将有标签数据聚类后的伪标签与人工标注的标签进行比较,对聚类错误的全部样本数据进行重新聚类,得到新的伪标签;
步骤4,若存在多个原聚类中的有标签数据都来自同一个行人,则将这多个原聚类进行合并,得到一个大聚类;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉大学,未经武汉大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211526656.8/2.html,转载请声明来源钻瓜专利网。