[发明专利]基于层次聚类与困难样本三元组的无监督行人重识别方法在审
申请号: | 202110131859.6 | 申请日: | 2021-01-30 |
公开(公告)号: | CN112926403A | 公开(公告)日: | 2021-06-08 |
发明(设计)人: | 王福银;韩华;王春媛;黄丽 | 申请(专利权)人: | 上海工程技术大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04 |
代理公司: | 上海科盛知识产权代理有限公司 31225 | 代理人: | 赵继明 |
地址: | 201620 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 层次 困难 样本 三元 监督 行人 识别 方法 | ||
1.一种基于层次聚类与困难样本三元组的无监督行人重识别方法,其特征在于,包括以下步骤:
1)将待处理的行人图像集合划分为训练集和测试集;
2)为所述训练集中的每个图像分配初始化的标签,设置训练阶段号的初始值为1;
3)将所述训练集的所有图像及其标签输入预先建立的CNN模型中,提取行人特征,进行模型训练;
4)对所述提取出的行人特征的特征集合进行从底向上的层次聚类,将相似的图像分配到同一簇中,根据簇分配结果,对图像的标签进行更新;
5)对步骤4)得到的簇类别进行抽样,重组得到新的训练集;
6)根据困难样本三元组损失函数,对步骤5)中重组得到新的训练集进行微调;
7)计算步骤6)得到的所述训练集的平均轮廓系数;
8)将步骤3)至7)作为一个训练阶段,计算当前训练阶段与上一时刻训练阶段中所述平均轮廓系数的差值,若该差值大于预设的差值变化阈值,则采用步骤7)得到的训练集返回步骤3),并将所述训练阶段号的数值加一;若该差值小于所述差值变化阈值,则以此时的训练集的聚类簇数为横坐标、以平均轮廓系数为纵坐标,绘制评估系数曲线图,并将该评估系数曲线图中曲线拐点对应的聚类簇数作为最佳聚类簇数、将采用该最佳聚类簇数的训练集训练得到的CNN模型作为最佳CNN模型;
9)将所述测试集载入所述最佳CNN模型中提取行人特征,并计算该行人特征与所述训练集对应的行人特征之间的距离,获取所述训练集中距离最小的行人图像对应的标签作为行人重识别结果。
2.根据权利要求1所述的一种基于层次聚类与困难样本三元组的无监督行人重识别方法,其特征在于,所述CNN模型的建立过程包括获取预训练后的ResNet50模型,将该ResNet50模型中最后一层的分类层替换为一个全连接层,该全连接层的输出维度为当前训练阶段中训练集中的簇数目。
3.根据权利要求1所述的一种基于层次聚类与困难样本三元组的无监督行人重识别方法,其特征在于,所述CNN模型的目标函数为log对数损失函数,该log对数损失函数的计算表达式为:
式中,表示预测图像xi属于簇的概率,Vj表示第j个簇的聚类中心,其取值为第j个簇中所有行人特征的均值,表示第个簇的聚类中心,Ck表示当前第k阶段的簇数目,C1=N,α∈(0,1)为平衡各个类别概率分布的参数,υ表示将特征归一化,按照计算得到;
进行反向传播时,按照更新图像xi所在的簇的聚类中心的特征;用最小化目标函数对CNN模型进行训练,直到收敛为止。
4.根据权利要求1所述的一种基于层次聚类与困难样本三元组的无监督行人重识别方法,其特征在于,步骤4)中,所述层次聚类具体为:
根据单个图像初始化簇,按照两个簇之间的相似度由大到小合并成新的簇,直到簇的数量不在变化为止;
所述两个簇之间的相似度的计算表达式为:
式中,为Ca簇的样本,为Cb簇的样本,na为Ca的样本个数,nb为Cb的样本个数,D(·)为欧式距离。
5.根据权利要求1所述的一种基于层次聚类与困难样本三元组的无监督行人重识别方法,其特征在于,步骤5)中,所述抽样具体为:
采用PK抽样法从P个簇类别中随机的抽取K个样本组合成所述新的数据集。
6.根据权利要求1所述的一种基于层次聚类与困难样本三元组的无监督行人重识别方法,其特征在于,步骤6)中,所述困难样本三元组损失函数Ltriplet的计算表达式为:
式中,为锚点,与为有相同标签的正样本,与为有不同标签的负样本,m为困难样本三元组损失的超参数余量,D(·)表示欧式距离。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海工程技术大学,未经上海工程技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110131859.6/1.html,转载请声明来源钻瓜专利网。