[发明专利]一种基于对称卷积神经网络的跨模态行人重识别方法有效

专利信息
申请号: 202011430914.3 申请日: 2020-12-07
公开(公告)号: CN112434654B 公开(公告)日: 2022-09-13
发明(设计)人: 张艳;相旭;唐俊;王年;屈磊 申请(专利权)人: 安徽大学
主分类号: G06V20/52 分类号: G06V20/52;G06V10/774;G06V10/764;G06V10/82;G06N3/04;G06N3/08
代理公司: 安徽省合肥新安专利代理有限责任公司 34101 代理人: 陆丽莉;何梅生
地址: 230601 安*** 国省代码: 安徽;34
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 对称 卷积 神经网络 跨模态 行人 识别 方法
【权利要求书】:

1.一种基于对称卷积神经网络的跨模态行人重识别方法,其特征是按如下步骤进行:

步骤1、采集N个行人的可见光图像集V,其中第i个行人的j张可见光图像记为Vi,且Vi={Vi1,Vi2,...,Vij},Vij表示第i个行人的第j张可见光图片,并为第i个行人赋予第i身份信息yi;i=1,2,…,N;

用红外光相机或者深度相机采集N个行人的红外光图像集T,其中第i个行人的m张红外光图像记为Ti,且Ti={Ti1,Ti2,...,Tim},Tim表示第i个行人的第m个红外光图像;

由其他已知身份信息的行人的可见光图片和红外光图像来构建检索库;

步骤2、构建由生成器和鉴别器组成的对称卷积神经网络;

所述生成器由两列独立的ResNet50网络构成,其中ResNet50网络由d个残差子模块构成,在第d-1个残差子模块之后添加一列全连接层S1,在第d个残差子模块之后添加一列全连接层S2

所述鉴别器由可见光图像分类器和红外光图像分类器组成;

初始化所述ResNet50网络的网络权重;

采用随机初始化方式来初始化所述全连接层与鉴别器的参数;

步骤3、将所述N个行人的可见光图像集V和红外光图像集T分别输入到两列独立的ResNet50网络中,并在第d-1个残差子模块后输出第d-1组可见光特征信息vd-1,以及第d-1组红外光特征信息td-1,再分别输入所述第d个残差子模块后,输出第d组可见光特征信息vd以及第d组红外光特征信息td

步骤4、构建第d-1个样本特征空间Xd-1

从第d-1个残差子模块输出的所有特征信息中,选取P个行人的可见光特征信息和红外光特征信息,每个行人的可见光特征信息vi,d-1和红外光特征信息ti,d-1各选取K个特征信息,构建第d-1个样本特征空间Xd-1

将所述第d-1个样本特征空间Xd-1一起输入到后续的全连接层S1中,并输出第d-1组可见光特征向量v′d-1和红外光特征向量t′d-1

步骤5、构建第d个样本特征空间Xd

从第d个残差子模块输出的所有特征信息中,选取P个行人的可见光特征信息和红外光特征信息,每个行人的可见光特征信息vi,d和红外光特征信息ti,d各选取K个特征信息,构建第d个样本特征空间Xd

再将所述第d个样本特征空间Xd一起输入到后续的全连接层S2中,并输出第d组可见光特征向量v′d和红外光特征向量t′d

步骤6、将所述第d-1组可见光特征向量v′d-1输入所述可见光图像分类器中,输出可见光的初始概率分布GV,将第d-1组红外光特征向量t′d-1输入到所述红外光图像分类器中,并输出红外光的初始概率分布GT;

利用式(1)构建身份损失函数LID

步骤7、从所述第d-1个样本特征空间Xd-1中选择第a个行人的第k个特征信息记为锚点样本特征向量,则与锚点样本特征向量具有相同身份信息的第a个行人的第z个特征信息记为第z个正样本特征向量,与具有不同身份信息的第f个行人的第c个特征信息记为第c个负样本特征向量,则利用式(2)建立混合三元损失函数LTRI1(Xd-1):

式(2)中,代表锚点样本特征向量与第z个正样本特征向量的欧式距离,代表锚点样本特征向量与第f个行人的第c个负样本特征向量的欧式距离,ρ1为混合三元损失函数LTRI1(Xd-1)预定义的最小间隔;

步骤8、从所述第d个样本特征空间Xd中选择第r个行人的第s个特征信息记为锚点样本特征向量,则与锚点样本特征向量具有相同身份信息的第r个行人的第b个特征信息记为第b个正样本特征向量,与具有不同身份信息的第h个行人的第q个特征信息记为第q个负样本特征向量,则利用式(3)建立混合三元损失函数LTRI2(Xd):

式(3)中,代表锚点样本特征向量与第b个正样本特征向量的欧式距离,代表锚点样本特征向量与第h个行人的第q个负样本特征向量的欧式距离,ρ2为混合三元损失函数LTRI2(Xd)预定义的最小间隔;

步骤9、利用式(4)建立混合三元损失函数LTRI

LTRI=LTRI1+LTRI2 (4)

利用式(5)建立全局损失函数LALL

LALL=LID+βLTRI (5)

式(5)中,β表示混合 三元损失函数LTRI的系数;

通过随机梯度下降法对式(5)进行优化求解,并进行梯度反向传播,训练所述对称卷积神经网的各个参数,得到初步训练后的对称卷积神经网络模型;

步骤10、将所述第d-1组可见光特征向量v′d-1输入所述初步训练后的对称卷积神经网络模型中可见光图像分类器中,输出可见光的概率分布GV′,将第d-1组红外光特征向量t′d-1输入到所述初步训练后的对称卷积神经网络模型中红外光图像分类器中,并输出红外光的概率分布GT′;将所述第d-1组可见光特征向量v′d-1输入到所述初步训练后的对称卷积神经网络模型中红外光分类器中得到伪可见光概率分布GV″;

利用式(6)构建所述伪可见光特征向量GV″与可见光概率分布GV′之间的散度损失函数LKL

LKL=KL(GV″,GV′) (6)

式(6)中,KL(·,·)表示两者概率分布的差异值;

利用式(7)建立鉴别器损失函数LDIS

LDIS=LID-αLKL (7)

式(7)中,α代表LKL的系数;

步骤11、利用式(8)建立生成器损失函数LGEN

LGEN=αLKL+βLTRI (8)

步骤12、通过梯度下降法依次对式(5)、式(7)、式(8)进行优化求解:

首先对式(5)进行优化求解,训练网络所有参数;

其次对式(7)进行优化求解,在梯度反向传播过程中,仅对鉴别器的梯度进行反向传播,将生成器的梯度置零,从而冻结生成器参数,训练鉴别器参数;

最后对式(8)进行优化求解,在梯度反向传播过程中,仅对生成器的梯度进行反向传播,将鉴别器的梯度置零,从而冻结鉴别器参数,训练生成器参数;

依次训练后使得LALL,LDIS,LGEN在对抗学习中收敛到最优,当LDIS达到最优时,鉴别器达到最优,当LGEN达到最优时,生成器达到最优,从而获得最终的对称卷积神经网络跨模态行人重识别模型;

步骤13、利用最终的对称卷积神经网络模型对跨模态行人重识别进行查询匹配;

将待查询的行人图像输入最终的对称卷积神经网络模型中提取特征,然后与检索库中行人的特征进行相似度比对,并按照相似度的高低排序,从排序列表中找到对应的行人身份信息,从而得到识别结果。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽大学,未经安徽大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202011430914.3/1.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top