[发明专利]一种基于Center Loss改进的人脸模型训练方法有效
申请号: | 201910173853.8 | 申请日: | 2019-03-08 |
公开(公告)号: | CN109902757B | 公开(公告)日: | 2023-04-25 |
发明(设计)人: | 赵晓丽;范继辉 | 申请(专利权)人: | 山东领能电子科技有限公司 |
主分类号: | G06V10/774 | 分类号: | G06V10/774;G06V10/82;G06V10/764;G06V40/16;G06N3/0464;G06N3/047;G06N3/084 |
代理公司: | 济南金迪知识产权代理有限公司 37219 | 代理人: | 许德山 |
地址: | 250101 山东省济南市历下区*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 center loss 改进 模型 训练 方法 | ||
1.一种基于Center Loss改进的人脸模型训练方法,其特征在于,包括步骤如下:
(1)使用MTCNN算法剪切原总数据集中的人脸图片,将剪切出的两张及以上张人脸图片筛选出来进行排查,保证人脸ID唯一,将剪切后的所有的人脸图片划分为训练集、验证集和测试集;
(2)对训练集中的人脸图片进行预处理;
(3)搭建网络结构,优化目标损失函数;
(4)将步骤(2)经过预处理的训练集中的数据输入到步骤(3)构建的网络结构中进行训练,输入到网络结构中的数据采用minibath策略,设置batch size大小为B,B不小于训练集中的样本数,batch的数目为N,N为训练集样本数除以B,训练的迭代轮数为E,E是指神经网络中传递完整的数据集的次数;训练中的损失函数为步骤(3)优化后的目标损失函数;在反向传播过程中,使用自适应参数更新算法Adam优化器,指数衰减学习率不断进行梯度更新减小损失函数,直到完成设置的迭代轮数E;
(5)保存人脸模型;
(6)使用测试集对人脸模型进行测试;
所述步骤(3)中,包括步骤如下:
C、搭建Inception-ResNet V1网络模型,输入人脸图片的初始形状为(160,160,3),第一个160是指图片的宽,第二个160是指图片的高,单位均为像素,3是图片的通道数,表示图像是由红色R、绿色G、蓝色B三个通道组成的;
D、将SoftMax Loss损失函数与改进后的Center Loss损失函数动态结合,共同作为神经网络训练中的目标损失函数,加入到计算过程中;
所述SoftMax Loss损失函数Ls,Center Loss损失函数Lc,以及SoftMax Loss损失函数Ls与改进后的Center Loss损失函数Lc动态结合的损失函数Ls_c的计算公式分别如式(Ⅰ)、式(Ⅱ)、式(Ⅲ)所示:
式(Ⅰ)、式(Ⅱ)、式(Ⅲ)中,
m表示训练中一个mini batch的训练样本总数;
n表示训练样本的人脸图片ID的个数;
x表示训练样本在网络结构的输出特征;
表示第i个样本的类别yi的偏置项;
表示网络结构输出层的权重矩阵W∈Rd×n的第j列的转置;
bj表示网络结构输出层的权重矩阵W∈Rd×n的第j列的偏置项;
xi∈Rd,表示第i个训练样本在网络结构的输出特征;
d表示特征维度;
cyi表示第i个训练样本的类别yi的中心;
Wyi∈Rd,表示网络结构输出层的权重矩阵W∈Rd×n的第yi列;
Wj∈Rd表示网络结构输出层的权重矩阵W∈Rd×n的第j列;
b∈Rn表示偏置项;
α表示Center Loss的占比,0≤α≤1,α在训练过程中动态变化,根据训练参数控制同类之间内聚程度;
所述α动态取值的方法如下:
设置Center Loss配置文件,在该文件中根据训练的轮数设置α值,设置迭代轮数分别为E1,E2,E3,E4,E5,E6,e表示第e轮,α1,α2,α3,α4,α5,α6表示对应的α值,训练的轮数e与设置的α值的关系如表1所示:
表1
。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东领能电子科技有限公司,未经山东领能电子科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910173853.8/1.html,转载请声明来源钻瓜专利网。