[发明专利]一种基于倒置残差结构和角度联合损失函数的移动端人脸检测方法在审
申请号: | 201811621566.0 | 申请日: | 2018-12-28 |
公开(公告)号: | CN109858362A | 公开(公告)日: | 2019-06-07 |
发明(设计)人: | 郑河荣;宁坤 | 申请(专利权)人: | 浙江工业大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62 |
代理公司: | 杭州之江专利事务所(普通合伙) 33216 | 代理人: | 张慧英 |
地址: | 310014 浙江省杭州*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 人脸检测 倒置 残差 损失函数 网络结构 移动端 内存消耗 联合 移动 准确率 减小 算法 内存 节约 保证 | ||
1.一种基于倒置残差结构和角度联合损失函数的移动端人脸检测方法,其特征在于,包括数据预处理、制作训练集和验证集、网络模型的构建和训练、网络模型基于AgeDB-30人脸库的验证四个阶段:
(1)数据的预处理:
(1.1)下载清洗后的MS-Celeb-1M人脸数据集;
(1.2)对所有人脸图像采用MTCNN算法进行人脸关键点检测、对齐并裁剪成112x112大小;
(1.3)对图像像素做归一化处理,归一化到[-1,1];
(1.4)根据图像的标注,生成图像的lst文件;
(2)制作训练集和验证集:
(2.1)将预处理后的数据转换为MXNet所能读取的二进制人脸数据集作为训练集;
(2.2)下载AgeDB-30人脸库,并制作成agedb_30.bin格式的数据集作为验证集;
(3)网络模型的构建和训练,输出训练好的网络模型;
(4)网络模型基于AgeDB-30人脸库的验证:
(4.1)基于训练好的网络模型对样本对中的两张图片提取特征然后进行比较,判断是否为同一个人;
(4.2)针对所有人脸样本对统计同脸判断错误和异脸判定错误的个数,计算得出判定精度;经过上述步骤的操作,即可实现移动端人脸的快速检测。
2.根据权利要求1所述的一种基于倒置残差结构和角度联合损失函数的移动端人脸检测方法,其特征在于:所述的人脸关键点包括眼睛中心、鼻尖、嘴角。
3.根据权利要求1所述的一种基于倒置残差结构和角度联合损失函数的移动端人脸检测方法,其特征在于:所述的lst文件内容包含对齐标签、图像路径、图像对应的身份标签,性别标签和年龄标签。
4.根据权利要求1所述的一种基于倒置残差结构和角度联合损失函数的移动端人脸检测方法,其特征在于:所述训练集的格式为.rec、.idx、property文件;其中train.rec是已经对齐后的图像数据,train.idx是索引,由步骤(1.4)中的lst文件生成rec和idx文件;property是属性文件,文件内容包含身份类别数和图像大小。
5.根据权利要求1所述的一种基于倒置残差结构和角度联合损失函数的移动端人脸检测方法,其特征在于:所述的训练集为包括超过380万张、8万7千个身份的训练集。
6.根据权利要求1所述的一种基于倒置残差结构和角度联合损失函数的移动端人脸检测方法,其特征在于:所述的验证集包含440个人12240张图片并标注了身份、年龄和性别,最小年龄为3,最大年龄为101,其中包含300个正样本对和300负样本对。
7.根据权利要求1所述的一种基于倒置残差结构和角度联合损失函数的移动端人脸检测方法,其特征在于:所述步骤(3)具体如下:
(3.1)基于MXNet深度学习框架构建网络模型,选用MS-Celeb-1M作为训练集,CombiledLoss作为损失函数,基于MobileFaceNets网络结构评估人脸检测的性能;
(3.2)网络结构采用倒置残差结构单元作为构建整个网络的基础单元,该网络输入维度是112×112,在网络开始部分采用快速下采样,中间由倒置残差结构单元构建,在倒数第二个卷积层采用线性全局深度卷积层,最后一个卷积层采用1×1的线性卷积层作为特征输出;
(3.3)训练样本类别数为n,样本数据x的维度为d,模型权重为w,归一化后的样本经过MobileFaceNets网络得到全连接输出cosθj,cosθj表示预测标签对应的值,其中j∈[1...n];并对输出cosθj所对应真实标签的值cosθyi执行反余弦操作得到θyi,yi表示对应的真实标签;
(3.4)损失层采用softmaxloss进行初调,softmax的目标是尽可能最大化正确分类的概率;
(3.5)基于步骤(3.4)得到的预训练模型,采用角度损失函数,公式如下:
其中cosθj表示预测标签对应的值,cosθyi表示真实标签对应的值,yi表示真实标签,s表示归一化参数,由于分类边界在很大程度上影响特征的分布,而基于角度距离的损失函数最基本的思想就是通过控制分类边界来产生类间距离,;增加参数m1,是对角度更严格的限制;cos(m1θ+m2)小于MobileFaceNets损失函数中的cos(θ+m2),其中m1、m2都为正数;通过这种方式来促使模型学到类间距离更大、类内距离更小的特征,采用倍角关系会使得学习到的w参数更加的扁平,可以加大样本的类间距离;参数m3表示余弦边距且为正数,为分类正确标签的值;
(3.6)经步骤(3.5)中损失函数的计算,输出训练好的网络模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811621566.0/1.html,转载请声明来源钻瓜专利网。