[发明专利]一种基于深度化可分离卷积模型的人脸识别方法有效
申请号: | 201810805062.8 | 申请日: | 2018-07-20 |
公开(公告)号: | CN108985236B | 公开(公告)日: | 2021-08-17 |
发明(设计)人: | 杨通;彭若波;杜曦 | 申请(专利权)人: | 南京开为网络科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06N3/04 |
代理公司: | 南京行高知识产权代理有限公司 32404 | 代理人: | 李晓 |
地址: | 210019 江苏省南京市建邺*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 可分离 卷积 模型 识别 方法 | ||
1.一种基于深度化可分离卷积模型的人脸识别方法,包括以下步骤:
第一步、读取人脸图像样本数据集,每幅人脸图像为3通道,其高度为112个像素,宽度为112个像素;
第二步、建立深度化可分离卷积模型,所述深度化可分离卷积模型在相邻的两个卷积模块之间级联了多个残差瓶颈模块,如下表所示:
输入图像大小 模块名称 通道数 重复次数 步幅间距 112*112*3 Conv3*3 64 1 2 56*56*64 Depthwise conv3*3 64 1 1 56*56*64 bottleneck 64 5 2 28*28*64 bottleneck 128 1 2 14*14*128 bottleneck 128 6 1 14*14*128 bottleneck 128 1 2 7*7*128 bottleneck 128 2 1 7*7*128 Conv1*1 512 1 1 7*7*512 linear GDConv7*7 512 1 1 1*1*512 linear conv1*1 128 1 1
表中,第一列为各模块的输入图像大小,第二列为模块名称,第三列为通道数,第四列为该模块的重复次数,第四列为步幅间距,卷积核采用3*3;
第三步、利用梯度下降算法更新深度化可分离卷积模型参数
1)通过所述深度化可分离卷积模型将所述样本数据集的人脸图像映射成512维特征向量;
2)计算损失函数,所述损失函数由Softmax函数和ArcFace函数加权构成,其中,Softmax函数的表达式如下:
式中,x表示样本经深度化可分离卷积模型映射而成的特征向量,N表示所述样本数据集的大小,i取值1~N,yi表示样本xi对应的标签;W向量表示待优化参数,包括和Wj,表示样本xi在其标签yi处的权重,Wj表示输出节点j处的权重;b向量包括和bj,表示样本xi在其标签yi处的偏差,bj表示输出节点j处的偏差;
ArcFace函数的表达式如下:
式中,为样本xi与其对应标签yi的权重的夹角,θj为样本xi与输出节点j处的权重Wj的夹角;m、s为预设参数,0.2≤m≤2,50≤s≤100;
最终的损失函数为:
Ltotal=Lsoftmax+Larcface;
3)计算损失函数的梯度下降距离其中μ是预设的学习率;
4)确定损失函数的梯度下降距离是否小于预设阈值ε,如果是则执行第四步,否则更新W向量后再执行步骤1),更新W向量的表达式如下:
第四步、通过更新参数后的深度化可分离卷积模型进行人脸识别。
2.根据权利要求1所述的基于深度化可分离卷积模型的人脸识别方法,其特征在于:第一步中,对人脸图像样本数据集中已有的人脸数据样本通过FaceNet方法进行映射,得到在X维特征空间的一系列特征向量集合Λ={λ1,λ2,λ3,···,λx};
假设Λ中的两组X维特征向量分别为λi={vi1,vi2,...,vix},λj={vj1,vj2,...,vjx},
则两组X维特征向量的夹角
当两组特征向量的夹角θ的余弦值小于预设阈值时,则两组特征向量对应的人脸数据样本具有相似性,并对具有相似性的人脸数据样本进行去重。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京开为网络科技有限公司,未经南京开为网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810805062.8/1.html,转载请声明来源钻瓜专利网。