[发明专利]一种基于稀疏图相似度迁移的视觉行人重识别方法有效
申请号: | 202110192173.8 | 申请日: | 2021-02-19 |
公开(公告)号: | CN112860936B | 公开(公告)日: | 2022-11-29 |
发明(设计)人: | 丁贵广;陈辉 | 申请(专利权)人: | 清华大学 |
主分类号: | G06F16/583 | 分类号: | G06F16/583;G06V40/10;G06V10/40;G06V10/75;G06V10/764 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 韩海花 |
地址: | 10008*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 稀疏 相似 迁移 视觉 行人 识别 方法 | ||
本发明提供一种基于稀疏图相似度迁移的视觉行人重识别方法,该方法包括使用同一个训练好的深度卷积网络抽取行人图像数据库中的每张行人图像和查询图像的特征并通过特征向量表示,通过特征向量计算任意两张行人图像的相似度,并构建数据库图像密集关联图;对数据库图像密集关联图进行稀疏约束得到数据库图像稀疏图;使用能量最小随机游走模型,将计算查询图像和行人图像的相似度的值当成一种能量在数据库图像稀疏图随机迁移,稳定后的能量值为查询图像和行人图像的一致性得分,基于一致性得分对数据库图像稀疏图进行排序,并返回得分最高的行人图像。采用上述方案的本发明提高视觉行人重识别的检索精度和速度。
技术领域
本发明涉及计算机算法领域,可应用于行人重识别任务的重排序学习,尤其涉及一种 基于稀疏图相似度迁移的视觉行人重识别方法。
背景技术
行人重识别可以帮助人们快速查找特定人物,借助于当前数量日益增长的城市监控摄 像头,维护社会治安,促进社会公共安全乃至国家安全。由于在安防领域的重要作用和突 出价值,行人重识别成为计算机视觉研究社区的重要研究方向。研究者们一直在试图建立 一个强大的行人重识别模型,可以快递建立特定行人画像和监控摄像头下真实画面中的行 人画面的关联关系,进而实现智能识别和定位的目的,但是开放环境下拍摄到的行人画面 具有多种多样的特征,比如角度,环境光照,遮挡等等,给行人的精准识别带来了严峻的 挑战。
当前的研究主要集中在如何学习有效的行人特征。得益于深度学习和大数据的发展, 基于深度卷积神经网络的行人重识别模型在精确检索性能上取得了很大的提升,在一些日 常使用的标准评测数据集上取得了超过人类指标的成绩。一般的,这些方法都是希望卷积 神经网络学习到不同身份的行人的显著性特征。对于给定的查询图片和数据库里的图片, 模型首先使用多层的卷积层和下采样层将高维图像信息映射到低维的特征空间,比如1024 维。很多工作在卷积神经网络的结构设计上进行研究,比如设计了多粒度的特征提取头, 以及结合注意力机制的特征抽取方法。也有一些工作探索卷积神经网络的训练学习机制, 比如融合验证损失函数和度量学习的损失函数,使得训练更加平稳,收敛更加快速,得到 的模型泛化能力更强。
尽管基于行人特征学习的行人重识别方法可以取得不错的性能,但是由于实际场景中 错综复杂的应用条件,无法保证模型能够学习到通用的行人特征,导致检索到的行人和查 询可能不相符。为了提升行人重识别系统的准确率,研究者提出了重排序学习的方法,进 一步提高行人重识别的准确度。比如使用查询扩展的方法进一步调优查询图像的行人特征, 然后做二次查询;基于互为k近邻的重排序方法对查询图像和数据库图像集的近邻关系加 强约束,使得互为近邻的图像能够优先被检索到;为了捕捉特征流形空间的几何结构信息, 基于流形学习的方法利用标签传播的方法将有标注图像的信息转移到相同流形上的无标注 图像上,进而提升检索效果。
当前的重识别方法可以极大地提升行人重识别的检索准确率,但是也存在算法复杂度 高,计算效率低下的问题。比如基于查询扩展的方法需要进行两次特征度量学习和一次特 征融合,互为k近邻的方法需要遍历所有图像以确定互为近邻的图像,流形学习的方法得 对大量有标签数据建立密集关联图进行标签传播学习,尽管可以采用线下学习的方式,但 是巨大的关联图限制了其计算效率。因此,探索高效精准的重排序方法以提高视觉行人重 识别的检索精度仍需要进一步的研究。
发明内容
本发明旨在至少在一定程度上解决相关技术中的技术问题之一。
为此,本发明的第一个目的在于提出一种基于稀疏图相似度迁移的视觉行人重识别方 法,该方法可以线下学习特征流形上图像之间的相似关联关系,并能在线上快速重计算查 询图像和流行空间中数据点的一致性得分,实现线上快速重排序,并提高重排序后的检索 准确性。这种重排序方法可以被广泛应用于视觉行人重识别任务中,包括有监督行人重识 别,无监督行人重识别,跨模态行人重识别等。
本发明的第二个目的在于提出一种计算机设备。
本发明的第三个目的在于提出一种非临时性计算机可读存储介质。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110192173.8/2.html,转载请声明来源钻瓜专利网。