[发明专利]一种基于IMobileNet的人脸快速识别方法有效
申请号: | 202010459770.8 | 申请日: | 2020-05-26 |
公开(公告)号: | CN111695450B | 公开(公告)日: | 2023-05-09 |
发明(设计)人: | 黄杰;赵翔宇 | 申请(专利权)人: | 东南大学 |
主分类号: | G06V40/16 | 分类号: | G06V40/16;G06V10/82;G06N3/0464;G06N3/047;G06N3/048;G06N3/08 |
代理公司: | 南京众联专利代理有限公司 32206 | 代理人: | 许小莉 |
地址: | 210096 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 imobilenet 快速 识别 方法 | ||
1.一种基于IMobileNet的人脸快速识别方法,其特征在于:该方法包括如下步骤:
1)选择人脸图像数据库并对人脸图像进行预处理,预处理包括:人脸对齐、图像尺度变换、图像像素归一化;
(2)利用轻量级神经网络IMobileNet搭建人脸分类器网络;
(3)将步骤(1)中经过预处理的图片样本输入到步骤(2)中搭建的网络中进行训练;
(4)保存训练模型,将网络中softmax层的前一层作为人脸的特征向量,并利用特征向量进行人脸识别;
步骤(2)所述的轻量级神经网络IMobileNet使用了Inception网络和SE模块,包含了2个Mobile-Inception模块与6个Mobile-Resnet模块,其中每个Mobile-Inception模块的宽度为3,在第一个分支中,使用了两个内核为3×3的DW卷积与一个SE模块串联,在第二个分支中,使用了一个内核为3×3的DW卷积与一个SE模块串联,第三个分支使用了一个1×1的卷积模块;每个Mobile-Resnet模块具有两个分支,最右侧的分支首先将输入的维度降为1/4,再进行卷积,最后进行升维,与输入相加;
步骤(3)中所述训练时采用了中心损失与交叉熵损失结合作为损失函数的方式,在训练时,数据按照批次输入网络进行训练,在将所有数据训练一次后,称为完成了一个时期的训练;
在按照批次训练时,令网络输入向量为I(i1,i2,...,im),m∈N,输出向量为z(z1,z2,...,zu),u∈N,在每个容量大小为a的批次中,交叉熵损失Ls表示为:
中心损失Lc的定义为:
其中,xi为全连接层之前的特征,表示第yi个类别的特征中心,Zi为输出向量中的第i列,Zj为输出向量中的第j列;
第yi个类别的特征中心在每个时期结束之后,需要进行更新,通过下式更新:
其中函数的含义为如果括号内的函数条件为真,函数的返回值为1,否则返回值为0,
整个网络总的损失函数L=Ls+λLc,λ的取值在0-1之间;
所述步骤(4)具体包括以下步骤:
(41)将两张经过步骤(1)中预处理后的待识别人脸图片输入分类器,利用IMobileNet网络进行特征提取,将网络中softmax层的前一层作为人脸的特征向量;
(42)利用余弦相似度比较输入的两张人脸图片是否为同一人:
假设有人脸特征向量X,Y,那么人脸的余弦相似度sim(X,Y)可表示为:
其中,θ表示X,Y之间的夹角,
在(0,180°)内,θ越大,相似度越低,通过设定θ的阈值来判定两个特征向量是否属于同一个输入,当输入的两张人脸图像的余弦相似度小于阈值时,判定输入的是同一个人物的图像,否则判定输入的是不同人物的图像。
2.根据权利要求1所述的基于IMobileNet的人脸快速识别方法,其特征在于:步骤(1)所述人脸图像数据库为CASIA-WebFace,人脸图像预处理包含以下步骤:
(11)利用MTCNN人脸检测框架检测输入图像的5个人脸特征坐标;
(12)利用5个人脸特征坐标进行人脸对齐,使得每个人脸图像的眼睛处于同一水平线上,每个人脸图像的鼻尖处于同一垂直线上;
(13)将人脸对齐后的图片缩放至128*128大小,并将图像进行标准化处理,即将图片的像素值转化为服从高斯分布的零均值、单位方差的像素值。
3.根据权利要求1所述的基于IMobileNet的人脸快速识别方法,其特征在于:步骤(42)所述阈值的选取方法是:利用LFW数据集提供的人脸样本进行阈值的选取,通过10折交差验证法,得出阈值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南大学,未经东南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010459770.8/1.html,转载请声明来源钻瓜专利网。