[发明专利]一种基于摄像头关系的自监督行人重识别方法在审
申请号: | 202110685408.7 | 申请日: | 2021-06-21 |
公开(公告)号: | CN113536946A | 公开(公告)日: | 2021-10-22 |
发明(设计)人: | 丁贵广;何涛;沈乐琦 | 申请(专利权)人: | 清华大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/32;G06K9/46;G06K9/62;G06F17/16 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 王萌 |
地址: | 10008*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 摄像头 关系 监督 行人 识别 方法 | ||
1.一种基于摄像头关系的自监督行人重识别方法,其特征在于,包括以下步骤:
获取监控摄像头网络采集的行人图片数据;
对所述行人图片数据进行预处理,并使用预先建立的视觉模型对预处理后的行人图片数据进行特征提取,以得到所述行人图片数据的特征向量,其中,所述预先建立的视觉模型具有初始化参数网络;
根据所述行人图片数据的特征向量,确定所述监控摄像头网络中摄像头的特异性关系;
根据所述特异性关系进行特征类别聚类,得到伪标签信息,根据所述伪标签信息对所述视觉模型的所述初始化参数网络进行更新。
利用更新后的所述视觉模型对待识别图片样本进行特征提取,根据提取到的特征向量得到最终的检索队列。
2.如权利要求1所述的方法,其特征在于,获取监控摄像头网络采集的行人图片数据,包括:
将所述监控摄像头网络部署到预设的应用场景,利用行人检测采集功能,在多个时间段内,不同的光线条件下,采集各个行人的图片,并将行人图片作为训练数据存储至行人训练数据库。
3.如权利要求2所述的方法,其特征在于,对所述行人图片数据进行预处理,包括:
对所述行人图片数据进行数据增强处理和归一化处理;
对所述行人图片数据进行数据增强处理,包括随机水平翻转图片操作、随机图片剪裁操作、随机图片色彩扰动操作和图片上下左右填充操作中的一种或者多种。
4.如权利要求2或3所述的方法,其特征在于,使用预先建立的视觉模型对预处理后的行人图片数据进行特征提取,包括:
使用所述视觉模型的初始化参数网络作为特征提取器,对所述训练数据进行特征提取。
5.如权利要求1所述的方法,其特征在于,根据所述行人图片数据的特征向量,确定所述监控摄像头网络中摄像头的特异性关系,包括:
将所有的特征向量vi,按照图片所采集的摄像头标签进行分类,根据下述公式计算每一个摄像头下的平均特征向量:
其中,表示摄像ci采集所有图片的平均特征向量,表示该摄像头ci下采集的样本数量,vi表示图片xi的特征向量,ci表示图片样本xi所属的摄像头;
利用平均特征向量,根据下述公式计算任意两个摄像头之间的相似度对应关系:
其中,摄像头之间的相似度对应关系s(ci,cj)采用的余弦距离计算公式,两摄像头的平均特征向量的方向夹角越小,相似度对应关系s(ci,cj)反应出两个摄像头的距离越小;
组成摄像头关系的相似矩阵,
其中,所述摄像头关系的相似矩阵用于表征摄像头的特异性关系。
6.如权利要求1所述的方法,其特征在于,根据所述特异性关系进行特征类别聚类,包括:
通过摄像头特异性值vc确定聚类的阈值ε,其中,跨摄像头特异性动态聚类算法下的聚类阈值关系εd定义如下:
根据不同的摄像头的聚类阈值关系εd确定了聚类阈值矩阵定义如下:
根据具有摄像头特异性的聚类阈值矩阵对该模型对数据进行跨摄像头的聚类操作。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110685408.7/1.html,转载请声明来源钻瓜专利网。