[发明专利]基于级联深度卷积神经网络的人脸检测方法在审
申请号: | 201811326169.0 | 申请日: | 2018-11-08 |
公开(公告)号: | CN109614866A | 公开(公告)日: | 2019-04-12 |
发明(设计)人: | 温峻峰;江志伟;李鑫;杜海江;夏欢;谢巍;张浪文;翁冠碧 | 申请(专利权)人: | 中科天网(广东)科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京联瑞联丰知识产权代理事务所(普通合伙) 11411 | 代理人: | 张清彦 |
地址: | 510070 广东省广州市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 人脸检测 损失函数 卷积 卷积神经网络 训练样本 特征图 级联 卷积运算 质量评价 高维 人脸 向量 图像质量评价 人脸图像 输出 串行化 连接层 填充 重复 更新 网络 | ||
1.一种基于级联深度卷积神经网络的人脸检测方法,其特征在于,包括如下步骤:
A)建立n级深度卷积网络;所述n级深度卷积网络包括n个卷积层、一个全连接层、一个人脸框输出层和一个人脸质量评价输出层,每个所述卷积层中含有多个正方形卷积核和长方形卷积核,所述人脸框输出层设有多个节点,所述人脸质量评价输出层设有多个节点,所述n为整数且n≥1;
B)选取若干个输入图像作为训练样本,对当前训练样本的边缘处进行行数和列数的填充,得到填充图像,并将所述填充图像分别与第一层所述卷积层中的每个卷积核进行卷积运算,得到多个特征图;
C)将所述特征图中的部分或全部特征图作为下一层所述卷积层的输入,并将其分别与下一层所述卷积层中的每个卷积核进行卷积运算,得到多个对应的特征图;
D)重复上述步骤C)直至到第n+1层所述卷积层;
E)将第n+1层所述卷积层输出的特征图串行化得到高维向量,将所述高维向量与所述全连接层的节点进行全连接;
F)通过所述人脸框输出层输出人脸框坐标,通过所述人脸质量评价输出层输出人脸质量评价得分;
G)根据所述人脸框坐标,计算出包围框坐标偏移量,得到人脸检测损失函数;
H)用Softmax loss函数来表示图像质量评价损失函数;
I)对所述人脸检测损失函数和图像质量评价损失函数进行加权叠加后得到当前所述训练样本的损失函数;
J)对每个训练样本的损失函数进行求和,得到总损失函数;
K)当其中一级深度卷积网络训练结束后,用训练好的深度卷积网络计算出每个训练样本的损失函数,将损失函数大的训练样本的权值进行增大,将损失函数小的训练样本的权值进行减小,完成对每个所述训练样本的权值的更新;
L)通过所述步骤A)至步骤K)的学习方式,将多级深度卷积网络串起来训练出级联深度卷积神经网络,采用所述级联深度卷积神经网络进行人脸检测,去除非人脸窗口。
2.根据权利要求1所述的基于级联深度卷积神经网络的人脸检测方法,其特征在于,在所述第n级深度卷积网络中,所述全连接层的节点数为64x2(n-1),从所述全连接层往左算起,第m个卷积层的卷积核的大小分别为(1+2m)×(1+2m)、(3+2m)×(1+2m)和(1+2m)×(3+2m),通道数均为16×2(n-m),所述m为整数且0<m<n+2。
3.根据权利要求2所述的基于级联深度卷积神经网络的人脸检测方法,其特征在于,在所述步骤B)中,令所述当前训练样本的大小为Iy×Ix,卷积核的大小为ky×kx,在所述当前训练样本的边缘处用0填充的行数和列数分别为和输出的特征图的大小为Fy×Fx,存在如下关系:
Fy=Iy+2*Py-ky+1=Iy
Fx=Ix+2*Px-kx+1=Ix
其中,Iy表示当前训练样本的行数,Ix表示当前训练样本的列数,ky为卷积核的行数,kx为卷积核的列数,ky和kx均为奇数,Fy表示特征图的行数,Fx表示特征图的列数。
4.根据权利要求3所述的基于级联深度卷积神经网络的人脸检测方法,其特征在于,所述高维向量的长度为3*16×2(n-1)×Fy×Fx,所述高维向量与所述全连接层的节点全连接的连接数为3*16×2(n-1)×Fy×Fx×64×2(n-1)。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中科天网(广东)科技有限公司,未经中科天网(广东)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811326169.0/1.html,转载请声明来源钻瓜专利网。