[发明专利]行人重识别残差网络训练方法及装置在审
申请号: | 201811237115.7 | 申请日: | 2018-10-23 |
公开(公告)号: | CN109598191A | 公开(公告)日: | 2019-04-09 |
发明(设计)人: | 蔡晓聪;侯军;伊帅;闫俊杰 | 申请(专利权)人: | 北京市商汤科技开发有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京林达刘知识产权代理事务所(普通合伙) 11277 | 代理人: | 刘新宇 |
地址: | 100084 北京市海淀区中*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 残差 网络 空间损失 样本图像 映射 余弦 网络训练 球面 网络鲁棒性 反向传播 特征输入 网络结构 网络性能 映射层 卷积 保证 | ||
1.一种行人重识别残差网络训练方法,其特征在于,所述方法包括:
将样本图像输入行人重识别残差网络的卷积层进行处理,以提取所述样本图像的特征;
将所述特征输入所述行人重识别残差网络的映射层进行球面映射,以得到所述特征的映射值;
根据所述映射值确定所述样本图像的余弦空间损失;
向所述行人重识别残差网络反向传播所述余弦空间损失的梯度,以调整所述行人重识别残差网络的参数。
2.根据权利要求1所述的方法,其特征在于,所述根据所述映射值确定所述样本图像的余弦空间损失,包括:
将所述特征的映射值输入所述行人重识别残差网络的分类层进行处理,得到所述样本图像的识别结果;
根据所述样本图像的识别结果和所述样本图像的实际标识,确定所述样本图像的余弦空间损失。
3.根据权利要求2所述的方法,其特征在于,所述根据所述样本图像的识别结果和所述样本图像的实际标识,确定所述样本图像的余弦空间损失,包括:
根据所述样本图像的识别结果和所述样本图像的实际标识,利用交叉熵损失函数确定所述样本图像的余弦空间损失。
4.根据权利要求1至3中任一项所述的方法,其特征在于,所述方法还包括:
将所述特征输入所述行人重识别残差网络的全连接层进行处理,得到所述样本图像的设定维度特征;
将所述特征输入所述行人重识别残差网络的映射层进行球面映射,以得到所述特征的映射值,包括:
将所述设定维度特征输入所述行人重识别残差网络的映射层进行球面映射,以得到所述特征的映射值。
5.一种行人重识别残差网络训练装置,其特征在于,所述装置包括:
特征提取模块,用于将样本图像输入行人重识别残差网络的卷积层进行处理,以提取所述样本图像的特征;
映射模块,用于将所述特征输入所述行人重识别残差网络的映射层进行球面映射,以得到所述特征的映射值;
损失确定模块,用于根据所述映射值确定所述样本图像的余弦空间损失;
反向传播模块,用于向所述行人重识别残差网络反向传播所述余弦空间损失的梯度,以调整所述行人重识别残差网络的参数。
6.根据权利要求5所述的装置,其特征在于,所述损失确定模块,包括:
识别结果获取子模块,用于将所述特征的映射值输入所述行人重识别残差网络的分类层进行处理,得到所述样本图像的识别结果;
损失确定子模块,用于根据所述样本图像的识别结果和所述样本图像的实际标识,确定所述样本图像的余弦空间损失。
7.根据权利要求6所述的装置,其特征在于,所述损失确定子模块,用于根据所述样本图像的识别结果和所述样本图像的实际标识,利用交叉熵损失函数确定所述样本图像的余弦空间损失。
8.根据权利要求5至7中任一项所述的装置,其特征在于,所述装置还包括:
维度转换模块,用于将所述特征输入所述行人重识别残差网络的全连接层进行处理,得到所述样本图像的设定维度特征;
所述映射模块,用于将所述设定维度特征输入所述行人重识别残差网络的映射层进行球面映射,以得到所述特征的映射值。
9.一种电子设备,其特征在于,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为:执行权利要求1至4中任意一项所述的方法。
10.一种计算机可读存储介质,其上存储有计算机程序指令,其特征在于,所述计算机程序指令被处理器执行时实现权利要求1至4中任意一项所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京市商汤科技开发有限公司,未经北京市商汤科技开发有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811237115.7/1.html,转载请声明来源钻瓜专利网。