[发明专利]行人重识别残差网络训练方法及装置在审
申请号: | 201811237115.7 | 申请日: | 2018-10-23 |
公开(公告)号: | CN109598191A | 公开(公告)日: | 2019-04-09 |
发明(设计)人: | 蔡晓聪;侯军;伊帅;闫俊杰 | 申请(专利权)人: | 北京市商汤科技开发有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京林达刘知识产权代理事务所(普通合伙) 11277 | 代理人: | 刘新宇 |
地址: | 100084 北京市海淀区中*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 残差 网络 空间损失 样本图像 映射 余弦 网络训练 球面 网络鲁棒性 反向传播 特征输入 网络结构 网络性能 映射层 卷积 保证 | ||
本公开涉及一种行人重识别残差网络训练方法及装置。所述方法包括:将样本图像输入行人重识别残差网络的卷积层进行处理,以提取所述样本图像的特征;将所述特征输入所述行人重识别残差网络的映射层进行球面映射,以得到所述特征的映射值;根据所述映射值确定所述样本图像的余弦空间损失;向所述行人重识别残差网络反向传播所述余弦空间损失的梯度,以调整所述行人重识别残差网络的参数。本公开实施例中的行人重识别残差网络具有残差网络的网络结构,可以提高行人重识别残差网络的深度,并保证行人重识别残差网络的网络性能。利用余弦空间损失进行训练,可以提高行人重识别残差网络鲁棒性和精度。
技术领域
本公开涉及图像处理技术领域,尤其涉及一种行人重识别残差网络训练方法及装置。
背景技术
传统的行人重识别方法依赖于深度卷积神经网络,受到行人穿着、遮挡、姿态、视角以及卷积神经网络的深度不够等影响,导致卷积神经网络的行人重识别准确率低。当有新的行人图像需要重识别时,需要根据新的行人图像重新对重识别网络进行训练,重识别网络的鲁棒性差、识别精度低。
发明内容
本公开提出了一种行人重识别残差网络训练装置技术方案。
根据本公开的一方面,提供了一种行人重识别残差网络训练方法,包括:
将样本图像输入行人重识别残差网络的卷积层进行处理,以提取所述样本图像的特征;
将所述特征输入所述行人重识别残差网络的映射层进行球面映射,以得到所述特征的映射值;
根据所述映射值确定所述样本图像的余弦空间损失;
向所述行人重识别残差网络反向传播所述余弦空间损失的梯度,以调整所述行人重识别残差网络的参数。
在一种可能的时间方式中,所述根据所述映射值确定所述样本图像的余弦空间损失,包括:
将所述特征的映射值输入所述行人重识别残差网络的分类层进行处理,得到所述样本图像的识别结果;
根据所述样本图像的识别结果和所述样本图像的实际标识,确定所述样本图像的余弦空间损失。
在一种可能的时间方式中,所述根据所述样本图像的识别结果和所述样本图像的实际标识,确定所述样本图像的余弦空间损失,包括:
根据所述样本图像的识别结果和所述样本图像的实际标识,利用交叉熵损失函数确定所述样本图像的余弦空间损失。
在一种可能的时间方式中,所述方法还包括:
将所述特征输入所述行人重识别残差网络的全连接层进行处理,得到所述样本图像的设定维度特征;
将所述特征输入所述行人重识别残差网络的映射层进行球面映射,以得到所述特征的映射值,包括:
将所述设定维度特征输入所述行人重识别残差网络的映射层进行球面映射,以得到所述特征的映射值。
根据本公开的一方面,提供了一种行人重识别残差网络训练装置,所述装置包括:
特征提取模块,用于将样本图像输入行人重识别残差网络的卷积层进行处理,以提取所述样本图像的特征;
映射模块,用于将所述特征输入所述行人重识别残差网络的映射层进行球面映射,以得到所述特征的映射值;
损失确定模块,用于根据所述映射值确定所述样本图像的余弦空间损失;
反向传播模块,用于向所述行人重识别残差网络反向传播所述余弦空间损失的梯度,以调整所述行人重识别残差网络的参数。
在一种可能的时间方式中,所述损失确定模块,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京市商汤科技开发有限公司,未经北京市商汤科技开发有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811237115.7/2.html,转载请声明来源钻瓜专利网。