[发明专利]神经网络的训练和人脸识别方法及装置、设备、存储介质在审
申请号: | 201710929741.1 | 申请日: | 2017-09-30 |
公开(公告)号: | CN108229298A | 公开(公告)日: | 2018-06-29 |
发明(设计)人: | 黄诗尧;王飞;钱晨 | 申请(专利权)人: | 北京市商汤科技开发有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06N3/08 |
代理公司: | 北京思源智汇知识产权代理有限公司 11657 | 代理人: | 毛丽琴 |
地址: | 100084 北京市海淀区中*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 神经网络 损失函数 分类结果 样本图像 优化处理 存储介质 类别标签 人脸识别 计算损失函数 归一化处理 合理水平 角度处理 快速计算 标注 收敛 | ||
本发明实施例公开了一种神经网络的训练和人脸识别方法及装置、设备、存储介质,其中,训练方法包括:通过神经网络对样本图像进行处理,获得所述样本图像的分类结果;所述样本图像标注有类别标签;对所述分类结果执行优化处理,基于优化处理后的分类结果和已知的类别标签计算损失函数值;所述优化处理包括归一化处理和/或角度处理;基于所述损失函数值训练所述神经网络。本发明实施例实现快速计算损失函数;并且使损失函数值能下降到合理水平,不会遭遇损失函数收敛过慢的问题;通过该损失函数值训练的神经网络能够提取出更加紧致的特征。
技术领域
本发明涉及计算机视觉技术领域,尤其是一种神经网络的训练和人脸识别方法及装置、电子设备、计算机存储介质。
背景技术
近年来,由于深度神经网络的发展,深度神经网络已被广泛应用于各类识别任务中。对于一般的物体、场景或动作识别任务,其测试样例的类别都是包含在训练集中的,因此,神经网络提取出的不同类别的特征只需能在特征空间可分即可。而人脸识别任务具有一定的特殊性,由于收集全世界所有人的脸部图片用于网络训练在客观上是无法实现的,因此,实际存在大量测试样例不在训练集合中的情况,人脸识别仍然是计算机视觉领域中难度最高的识别任务之一。
发明内容
本发明实施例提供一种神经网络的训练和人脸识别技术。
本发明实施例提供的一种神经网络的训练方法,包括:
通过神经网络对样本图像进行处理,获得所述样本图像的分类结果;所述样本图像标注有类别标签,所述神经网络包括至少一个卷积层和两个全连接层;
对所述分类结果执行优化处理,基于优化处理后的分类结果和已知的类别标签计算损失函数值;所述优化处理包括归一化处理和/或角度处理;
基于所述损失函数值训练所述神经网络。
在基于本发明上述方法的另一个实施例中,所述神经网络包括至少一个卷积层和至少两个全连接层;
所述通过神经网络对样本图像进行处理,获得所述样本图像的分类结果,包括:
将样本图像输入所述神经网络,通过各所述卷积层对样本图像执行卷积计算,通过所述神经网络的第一个全连接层输出特征向量,通过所述神经网络的最后一个全连接层输出分类结果。
在基于本发明上述方法的另一个实施例中,还包括:
基于所述最后一个全连接层中权重值获取所述最后一个全连接层的权值向量;
对所述特征向量与所述权值向量执行点积操作,输出所述特征向量与所述权值向量的点积。
在基于本发明上述方法的另一个实施例中,所述优化处理包括归一化处理;
对所述获得的分类结果执行优化处理,包括:
将所述特征向量的模值归一化为特征常数,将所述权值向量的模值归一化为权值常数;
通过计算所述特征常数与权值常数和夹角余弦值的乘积,获得所述特征向量与所述权值向量的点积;所述夹角为所述特征向量与所述权值向量之间的夹角。
在基于本发明上述方法的另一个实施例中,所述优化处理包括角度处理;
对所述获得的分类结果执行优化处理,包括:
将夹角角度与角度裕量相乘获得新角度;所述夹角为所述特征向量与所述权值向量之间的夹角,所述角度裕量为常数;
通过计算所述特征向量的模值与所述权值向量的模值和新角度余弦值的乘积,获得所述特征向量与所述权值向量的点积。
在基于本发明上述方法的另一个实施例中,所述优化处理包括归一化处理和角度处理;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京市商汤科技开发有限公司,未经北京市商汤科技开发有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710929741.1/2.html,转载请声明来源钻瓜专利网。