[发明专利]一种角度余量自适应的人脸识别模型训练方法在审
申请号: | 202110456897.9 | 申请日: | 2021-04-27 |
公开(公告)号: | CN113076929A | 公开(公告)日: | 2021-07-06 |
发明(设计)人: | 杨绿溪;惠鸿儒;韩志伟;胡欣毅;俞菲;徐琴珍 | 申请(专利权)人: | 东南大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62 |
代理公司: | 南京瑞弘专利商标事务所(普通合伙) 32249 | 代理人: | 徐激波 |
地址: | 211189 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 角度 余量 自适应 识别 模型 训练 方法 | ||
1.一种角度余量自适应的人脸识别模型训练方法,其特征在于:包括以下步骤,
步骤1,基于人脸识别数据集,采用损失函数进行预训练,得到预训练模型;
步骤2,将人脸识别数据集中的样本输入预训练模型,得到对应的特征向量;
步骤3,对人脸识别数据集中的每个类别,分别求出对应的类内方差;
步骤4,根据所得每个类别对应的类内方差,得到对应的角度余量大小;
步骤5,结合每个类别的角度余量和加法角度余量损失函数,构成类别角度余量自适应的加法角度余量损失函数;
步骤6,用类别角度余量自适应的加法角度余量损失函数监督人脸识别模型进行训练,以端到端的方式,采用随机梯度下降法进行训练,当类别角度余量自适应的加法角度余量损失函数下降收敛后,保存网络参数,得到最终的人脸识别模型并可用于人脸识别。
2.如权利要求1所述的角度余量自适应的人脸识别模型训练方法,其特征在于:所述步骤1还包括,
步骤1.1,对预训练网络模型的参数进行初始化;
步骤1.2,以简单的人脸识别损失函数为监督,采用随机梯度下降法进行训练;
步骤1.3,当损失函数下降收敛后,保存网络参数,得到预训练模型。
3.如权利要求1或2所述的角度余量自适应的人脸识别模型训练方法,其特征在于:所述步骤2还包括,
步骤2.1,将数据集中的样本xi依次输入到预训练模型中,i=1,2,...,N,得到对应的特征向量f(xi);
步骤2.2,将特征向量f(xi)进行L2归一化。
4.如权利要求3所述的角度余量自适应的人脸识别模型训练方法,其特征在于:所述步骤3还包括,
步骤3.1,对数据集中的每个类别Cj,计算其平均特征向量μj,计算式为:
其中,nj为每个类别Cj的样本数;
步骤3.2,计算类内方差计算式为:
5.如权利要求4所述的角度余量自适应的人脸识别模型训练方法,其特征在于:所述步骤4还包括,
步骤4.1,确定角度余量值的上界Mmax和下界Mmin;
步骤4.2,统计得到所有类别中最大的方差Varmax和最小的方差Varmin;
步骤4.3,通过线性映射,将每个类别Cj的方差映射为角度余量值并且在映射中遵循类别角度余量值与对应的类内方差呈负相关的准则,即类内方差越大对应的角度余量越小,类内方差越小对应的角度余量越大,具体的映射公式为:
6.如权利要求5所述的角度余量自适应的人脸识别模型训练方法,其特征在于:所述步骤5还包括,
步骤5.1,将加法角度余量损失函数表达式中的固定角度余量参数修改为类别自适应的角度余量参数;
步骤5.2,将步骤4中得到的每个类别的角度余量值作为参数值,构成类别角度余量自适应的加法角度余量损失函数LCRMA,其计算公式为:
其中,yi表示i个样本所属的类别,表示类别yi在训练过程中的角度余量值,表示通过步骤4得到的类别yi对应的角度余量值,表示第i个样本输出的特征向量与其对应类中心的夹角,θj表示第i个样本输出的特征向量与第j类样本的类中心的夹角。
7.如权利要求6所述的角度余量自适应的人脸识别模型训练方法,其特征在于:所述步骤6还包括,
步骤6.1,对人脸识别网络模型的参数进行初始化;
步骤6.2,以类别角度余量自适应的加法角度余量损失函数作为监督,采用随机梯度下降法进行训练。
步骤6.3,当损失函数下降收敛后,保存网络参数,得到最终的人脸识别模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南大学,未经东南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110456897.9/1.html,转载请声明来源钻瓜专利网。