[发明专利]基于解纠缠和特征级差异学习的跨模态行人重识别方法有效
申请号: | 202110131884.4 | 申请日: | 2021-01-30 |
公开(公告)号: | CN112766217B | 公开(公告)日: | 2022-08-26 |
发明(设计)人: | 梁轶磊;韩华;孔勇;黄丽 | 申请(专利权)人: | 上海工程技术大学 |
主分类号: | G06V40/10 | 分类号: | G06V40/10;G06V20/52;G06V10/82;G06V10/774;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 上海科盛知识产权代理有限公司 31225 | 代理人: | 赵继明 |
地址: | 201620 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 纠缠 特征 级差 学习 跨模态 行人 识别 方法 | ||
1.一种基于解纠缠和特征级差异学习的跨模态行人重识别方法,其特征在于,包括以下步骤:
采用可见光摄像机和红外摄像机在不同的位置采集多张行人图片形成数据集,并对数据集中的图片进行预处理;
从所述数据集中选取可见光模态的两张输入图像记为x1和x2、选取红外模态的两张输入图像记为y1和y3,所述图像x1和y1共享身份信息,所述图像x2和y3不共享身份信息;
获取预先建立的解纠缠图像特征的自编码模型,采用该自编码模型分别对所述图像x1、x2、y1和y3进行解编码操作,解纠缠出每幅图像的风格特征和内容特征;
获取预先建立并训练好的生成与判别网络,将解纠缠获取每幅图像的风格特征和内容特征以及对应的原图像载入该生成与判别网络中;所述生成与判别网络包括解码器和判别器,所述解码器对所述风格特征和内容特征进行重构得到多个新图像,所述判别器对所述多个新图像和原图像进行判别,从而得到总体对抗损失;
获取预先建立并训练好的特征级差异学习网络,对所述多个新图像和原图像进行特征学习,获取行人识别结果;
所述生成与判别网络和特征级差异学习网络通过级联连接,所述生成与判别网络和特征级差异学习网络共同进行训练,所述生成与判别网络和特征级差异学习网络的总体损失函数包括解码器的损失函数、所述总体对抗损失和特征级差异学习网络的损失函数;
所述自编码模型包括提取不同模态行人图像风格的风格编码器和保持行人图像本身语义的内容编码器;
所述风格编码器的编码过程为和内容编码器的编码过程为和其中,表示图像θ的风格编码器,θ∈{x1,x2,y1,y3},表示图像θ的内容编码器,θ∈{x1,x2,y1,y3},为风格编码器对可见光模态的图像x1进行编码后的风格特征,为内容编码器对可见光模态的图像x1进行编码后的内容特征,为风格编码器对可见光模态的图像x2进行编码后的风格特征,为内容编码器对可见光模态的图像x2进行编码后的内容特征,为风格编码器对红外模态的图像y1进行编码后的风格特征,为内容编码器对红外模态的图像y1进行编码后的内容特征,风格编码器对红外模态的图像y3进行编码后的风格特征,为内容编码器对红外模态的图像y3进行编码后的内容特征;
所述解码器对所述风格特征和内容特征进行重构得到多个新图像具体为:
一方面,可见光模态风格特征和红外模态内容特征作为解码器G的输入,重构生成新的可见光模态行人图像x′1,可见光模态风格特征和红外模态内容特征作为解码器G的输入,重构生成新的可见光模态行人图像x″1,可见光模态风格特征和红外模态内容特征作为解码器G的输入,重构生成新的可见光模态行人图像x′2,
另一方面,红外模态风格特征和可见光模态内容特征作为解码器G的输入,重构生成新的红外模态行人图像y′1,红外模态风格特征和可见光模态内容特征作为解码器G的输入,重构生成新的红外模态行人图像y″1,红外模态风格特征和可见光模态内容特征作为解码器G的输入,重构生成新的红外模态行人图像y′3;
所述判别器对所述多个新图像和原图像进行判别具体为:
将重构生成的可见光模态行人图像x″1、x″1、x′2和真实的可见光模态行人图像x1输入到判别器中,判别输入的图像是真实的可见光模态行人图像还是解码器重构生成的,将重构生成的红外模态行人图像y″1、y″1、y′3和真实的红外模态行人图像y1输入到判别器中,判别输入的图像是真实的红外模态行人图像还是解码器重构生成的。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海工程技术大学,未经上海工程技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110131884.4/1.html,转载请声明来源钻瓜专利网。