[发明专利]一种基于深度级联卷积神经网络的快速人脸检测方法有效
申请号: | 201810668102.9 | 申请日: | 2018-06-26 |
公开(公告)号: | CN109190442B | 公开(公告)日: | 2021-07-06 |
发明(设计)人: | 杨波 | 申请(专利权)人: | 杭州雄迈集成电路技术股份有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06N3/04;G06N3/08 |
代理公司: | 杭州裕阳联合专利代理有限公司 33289 | 代理人: | 姚宇吉 |
地址: | 311400 浙江省杭州市富阳*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 级联 卷积 神经网络 快速 检测 方法 | ||
1.一种基于深度级联卷积神经网络的快速人脸检测方法,包括创建人脸数据集、组建深度级联卷积神经网络、测试网络模型,其特征在于:所述人脸数据集对人脸图像进行标注,使用多级金字塔缩放方法对人脸图像进行窗口滑动,将窗口与人脸矩形框的图像交并比IOU大于等于0 .7的窗口图像设置为正样本,图像交并比IOU小于0 .3的窗口图像设置为负样本,使用正负样本组成训练集和验证集,以训练所述深度级联卷积神经网络进行深度学习,在所述深度学习过程中加入性别分类辅助任务,同时采取微调训练;所述深度级联卷积神经网络包括至少三级级联卷积网络,第一级网络特征层和第二级网络特征层进行级联,第三级网络为单独网络并不和第二级网络级联,所述每一级网络都为全卷积网络包括多个卷积层和池化层,所述卷积层包括两个1x1的卷积层和一个3x3的卷积层;
每一级网络的最后一个卷积层为特征层,其后并使用1x1的卷积层代替全连接层作为输出层;
在深度学习阶段,人脸分类和性别属性分类任务采用交叉熵损失函数,人脸区域位置回归采用平滑损失函数SmoothL1Loss,总的损失函数为各个任务的损失函数通过不同的权重加权求和,其中性别属性分类任务属于辅助任务,
2.根据权利要求1所述的一种基于深度级联卷积神经网络的快速人脸检测方法,其特征在于:所述深度级联卷积神经网络为三级全卷积网络,其中:
第一级卷积神经网络采用12x12x3大小的图像作为输入,由48x48x3的图像进行两次2x2的均值池化得到,其最后一个特征层的大小为1x1x20,其后使用不同的1x1的卷积层作为不同任务的输出层;第二级卷积神经网络采用24x24x3大小的图像作为输入,由48x48x3的图像进行一次2x2的均值池化得到,其最后一个特征层的大小为1x1x144,再将该特征层和第一级网络特征层进行级联,形成1x1x164大小的级联层作为联合特征层,其后使用不同的1x1的卷积层作为不同任务的输出层;第三级卷积神经网络采用48x48x3大小的图像作为输入,其最后一个特征层的大小为1x1x512,其后使用不同的1x1的卷积层作为不同任务的输出层。
3.根据权利要求1所述的一种基于深度级联卷积神经网络的快速人脸检测方法,其特征在于:所述微调训练采用在线难负样本挖掘方法,在每个批次处理训练梯度更新时,对各个样本的损失值进行递减排序,只对前设定阈值比例的样本进行梯度更新,忽略损失值低的简单负样本。
4.根据权利要求1所述的一种基于深度级联卷积神经网络的快速人脸检测方法,其特征在于:人脸分类为三分类,性别属性分类为二分类。
5.根据权利要求1所述的一种基于深度级联卷积神经网络的快速人脸检测方法,其特征在于:所述人脸数据集对人脸图像进行标注包括人脸矩形框坐标、性别属性。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州雄迈集成电路技术股份有限公司,未经杭州雄迈集成电路技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810668102.9/1.html,转载请声明来源钻瓜专利网。