[发明专利]一种基于特征解耦学习的半监督行人重识别方法有效
申请号: | 202011222281.7 | 申请日: | 2020-11-05 |
公开(公告)号: | CN112307995B | 公开(公告)日: | 2022-03-25 |
发明(设计)人: | 周雪;郝戈寒;陈光箭;邹见效;徐红兵 | 申请(专利权)人: | 电子科技大学 |
主分类号: | G06V40/10 | 分类号: | G06V40/10;G06V10/774;G06V10/764;G06K9/62;G06V10/82;G06N3/04;G06N3/08 |
代理公司: | 成都行之专利代理事务所(普通合伙) 51220 | 代理人: | 温利平 |
地址: | 611731 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 特征 学习 监督 行人 识别 方法 | ||
1.一种基于特征解耦学习的半监督行人重识别方法,其特征在于,包括以下步骤:
(1)、构建一个半监督的行人重识别模型
基于一个身份编码器Eid、一个结构编码器Estruct以及一个解码器D构建一个特征解耦网络,并作为半监督的行人重识别模型;
(2)、训练半监督的行人重识别模型
2.1)、计算监督训练损失LS:
2.1.1)、将有标签Y的行人图像IO输入到半监督的行人重识别模型中,一方面直接分别通过身份编码器Eid、结构编码器Estruct进行编码,得到身份特征结构特征另一方面将行人图像IO水平翻转,生成水平翻转图像IT,然后,水平翻转图像IT,分别通过身份编码器Eid、结构编码器Estruct进行编码,得到身份特征结构特征
2.1.2)、身份特征通过GAPFC操作得到身份特征向量身份特征通过另一GAPFC操作得到身份特征向量(GAP,Global Average Pooling,即全局平均池化,FC,Fully connecting,即全连接);将身份特征向量进行分类操作,得到属于标签Y的预测概率,进而根据预测概率计算出标签一致性损失将身份特征向量进行另一分类操作,得到属于标签Y的预测概率,进而根据预测概率计算出标签一致性损失
2.1.3)、将身份特征结构特征级联,然后通过解码器D解码,得到重构图像将身份特征结构特征级联,然后通过解码器D解码,得到重构图像将身份特征结构特征级联,然后通过解码器D解码,得到重构图像将身份特征结构特征级联,然后通过解码器D解码,得到重构图像
计算自身图像重构损失
其中:|| ||2表示L2范数;
计算交换图像重构损失
其中:
这样得到图像重构损失Lrec:
2.1.4)、计算身份不变性约束损失Linv以及结构等变性约束损失Lequ:
其中,DKL(*||*)是表示计算两个特征的Kullback-Leibler散度距离,T(*)表示对特征进行水平翻转变换
这样得到解耦特征的一致性损失Lct:
Lct=Linv+Lequ
2.1.5)、根据步骤2.1.2)-2.1.4),得到监督训练损失LS:
其中,权重系数α、权重系数β可以根据经验进行设定;
2.2)、计算无监督训练损失LU:
2.2.1)、将无标签的行人图像I′O输入到半监督的行人重识别模型中,一方面直接分别通过身份编码器Eid、结构编码器Estruct进行编码,得到身份特征结构特征另一方面将行人图像I′O水平翻转,生成水平翻转图像I′T,然后,水平翻转图像I′T,分别通过身份编码器Eid、结构编码器Estruct进行编码,得到身份特征结构特征
2.2.2)、将身份特征结构特征级联,然后通过解码器D解码,得到重构图像将身份特征结构特征级联,然后通过解码器D解码,得到重构图像将身份特征结构特征级联,然后通过解码器D解码,得到重构图像将身份特征结构特征级联,然后通过解码器D解码,得到重构图像
计算自身图像重构损失
其中:|| ||2表示L2范数;
计算交换图像重构损失
其中:
这样得到图像重构损失 :
2.2.3)、计算恒等不变变换损失L′inv以及结构等方变换损失L′equ:
其中,DKL(*||*)是表示计算两个特征的Kullback-Leibler散度距离,T(*)表示对特征进行水平翻转变换;
这样得到解耦特征的一致性损失L′ct:
L′ct=L′inv+L′equ
2.2.4)、根据步骤2.2.2)-2.2.3),得到无监督训练损失LU:
LU=α′L′ct+β′L′rec
其中,权重系数α′、权重系数β′可以根据经验进行设定;
2.3)、计算总损失Ltotal:
Ltotal=LS+γLU
其中,权重系数γ可以根据经验进行设定;
2.4)、将总损失Ltotal用于优化整个半监督的行人重识别模型,不断输入有标签Y的行人图像IO以及无标签的行人图像I′O进行训练过程,总损失Ltotal不断下降直到趋于平稳,此时半监督的行人重识别模型训练结束;
(3)、构造一个查询数据集
在查询数据集中每个行人有一张图像,将每个行人的图像及其水平翻转图像分别输入到训练好的半监督的行人重识别模型中的身份编码器Eid,得到身份特征身份特征再分别经过GAPFC操作,得到身份特征向量身份特征向量将身份特征向量身份特征向量的平均值作为最终的身份特征向量vid,特征向量vid作为查询数据集中该行人的查询索引;
(4)、行人重识别
对于不知身份的行人图像,按照步骤(3)的方法,得到身份特征向量然后与查询数据集中所有身份特征向量vid计算余弦距离,余弦距离最小的身份特征向量vid所对应的行人图像中的行人即为识别出的行人。
2.根据权利要求1所述的基于特征解耦学习的半监督行人重识别方法,其特征在于,权重系数α=5、权重系数β=0.3、权重参数γ=0.01。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011222281.7/1.html,转载请声明来源钻瓜专利网。