[发明专利]一种基于倒置残差结构和角度联合损失函数的移动端人脸检测方法在审

申请号：	201811621566.0	申请日：	2018-12-28
公开（公告）号：	CN109858362A	公开（公告）日：	2019-06-07
发明（设计）人：	郑河荣;宁坤	申请（专利权）人：	浙江工业大学
主分类号：	G06K9/00	分类号：	G06K9/00;G06K9/62
代理公司：	杭州之江专利事务所(普通合伙) 33216	代理人：	张慧英
地址：	310014 浙江省杭州***	国省代码：	浙江;33
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	人脸检测倒置残差损失函数网络结构移动端内存消耗联合移动准确率减小算法内存节约保证
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于倒置残差结构和角度联合损失函数的移动端人脸检测方法，其特征在于，包括数据预处理、制作训练集和验证集、网络模型的构建和训练、网络模型基于AgeDB-30人脸库的验证四个阶段：

(1)数据的预处理：

(1.1)下载清洗后的MS-Celeb-1M人脸数据集；

(1.2)对所有人脸图像采用MTCNN算法进行人脸关键点检测、对齐并裁剪成112x112大小；

(1.3)对图像像素做归一化处理，归一化到[-1，1]；

(1.4)根据图像的标注，生成图像的lst文件；

(2)制作训练集和验证集：

(2.1)将预处理后的数据转换为MXNet所能读取的二进制人脸数据集作为训练集；

(2.2)下载AgeDB-30人脸库，并制作成agedb_30.bin格式的数据集作为验证集；

(3)网络模型的构建和训练，输出训练好的网络模型；

(4)网络模型基于AgeDB-30人脸库的验证：

(4.1)基于训练好的网络模型对样本对中的两张图片提取特征然后进行比较，判断是否为同一个人；

(4.2)针对所有人脸样本对统计同脸判断错误和异脸判定错误的个数，计算得出判定精度；经过上述步骤的操作，即可实现移动端人脸的快速检测。

2.根据权利要求1所述的一种基于倒置残差结构和角度联合损失函数的移动端人脸检测方法，其特征在于：所述的人脸关键点包括眼睛中心、鼻尖、嘴角。

3.根据权利要求1所述的一种基于倒置残差结构和角度联合损失函数的移动端人脸检测方法，其特征在于：所述的lst文件内容包含对齐标签、图像路径、图像对应的身份标签，性别标签和年龄标签。

4.根据权利要求1所述的一种基于倒置残差结构和角度联合损失函数的移动端人脸检测方法，其特征在于：所述训练集的格式为.rec、.idx、property文件；其中train.rec是已经对齐后的图像数据，train.idx是索引，由步骤(1.4)中的lst文件生成rec和idx文件；property是属性文件，文件内容包含身份类别数和图像大小。

5.根据权利要求1所述的一种基于倒置残差结构和角度联合损失函数的移动端人脸检测方法，其特征在于：所述的训练集为包括超过380万张、8万7千个身份的训练集。

6.根据权利要求1所述的一种基于倒置残差结构和角度联合损失函数的移动端人脸检测方法，其特征在于：所述的验证集包含440个人12240张图片并标注了身份、年龄和性别，最小年龄为3，最大年龄为101，其中包含300个正样本对和300负样本对。

7.根据权利要求1所述的一种基于倒置残差结构和角度联合损失函数的移动端人脸检测方法，其特征在于：所述步骤(3)具体如下：

(3.1)基于MXNet深度学习框架构建网络模型，选用MS-Celeb-1M作为训练集，CombiledLoss作为损失函数，基于MobileFaceNets网络结构评估人脸检测的性能；

(3.2)网络结构采用倒置残差结构单元作为构建整个网络的基础单元，该网络输入维度是112×112，在网络开始部分采用快速下采样，中间由倒置残差结构单元构建，在倒数第二个卷积层采用线性全局深度卷积层，最后一个卷积层采用1×1的线性卷积层作为特征输出；

(3.3)训练样本类别数为n，样本数据x的维度为d，模型权重为w，归一化后的样本经过MobileFaceNets网络得到全连接输出cosθ_j，cosθ_j表示预测标签对应的值，其中j∈[1...n]；并对输出cosθ_j所对应真实标签的值cosθ_yi执行反余弦操作得到θ_yi,y_i表示对应的真实标签；

(3.4)损失层采用softmaxloss进行初调，softmax的目标是尽可能最大化正确分类的概率；

(3.5)基于步骤(3.4)得到的预训练模型，采用角度损失函数，公式如下：

其中cosθ_j表示预测标签对应的值，cosθ_yi表示真实标签对应的值，y_i表示真实标签，s表示归一化参数，由于分类边界在很大程度上影响特征的分布，而基于角度距离的损失函数最基本的思想就是通过控制分类边界来产生类间距离,；增加参数m₁，是对角度更严格的限制；cos(m₁θ+m₂)小于MobileFaceNets损失函数中的cos(θ+m₂)，其中m₁、m₂都为正数；通过这种方式来促使模型学到类间距离更大、类内距离更小的特征，采用倍角关系会使得学习到的w参数更加的扁平，可以加大样本的类间距离；参数m₃表示余弦边距且为正数，为分类正确标签的值；

(3.6)经步骤(3.5)中损失函数的计算，输出训练好的网络模型。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于浙江工业大学，未经浙江工业大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201811621566.0/1.html，转载请声明来源钻瓜专利网。

上一篇：基于街景图像匹配重复结构建筑的定位方法
下一篇：一种狗鼻纹特征点的检测方法、装置、系统及存储介质

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于倒置残差结构和角度联合损失函数的移动端人脸检测方法在审

专利文献下载