[发明专利]基于MobileNet V3的实时人脸检测方法有效
申请号: | 201910796856.7 | 申请日: | 2019-08-27 |
公开(公告)号: | CN110647817B | 公开(公告)日: | 2022-04-05 |
发明(设计)人: | 孙俊;马栋梁;吴豪;吴小俊;方伟;陈祺东;李超;游琪;冒钟杰 | 申请(专利权)人: | 江南大学 |
主分类号: | G06V40/16 | 分类号: | G06V40/16;G06N3/04;G06N3/08 |
代理公司: | 大连理工大学专利中心 21200 | 代理人: | 梅洪玉;刘秋彤 |
地址: | 214122 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 mobilenet v3 实时 检测 方法 | ||
1.基于MobileNet V3的实时人脸检测方法,其特征在于,步骤如下:
步骤一、输入图片,并针对图片进行预处理操作;
步骤二、SSRFD检测器加载预训练网络参数,并根据预先设定好的锚点的尺寸以及长宽比例,生成默认的锚点;所述SSRFD检测器包括主干网络、轻量级特征提高模块、预测层和多任务损失层构成;所述的主干网络为MobileNet V3,包括6个卷积层;所述的轻量级特征提高模块首先采用1x1卷积对特征进行规范化映射处理;然后,采用不同尺寸的卷积核并行化处理特征,其中每个分支具有相应的扩张率;将不同分支的特征拼接之后,进行逐点操作以及残差操作,使得最后得到特征更具有辨别性;
步骤三、将预处理好的图片放入预训练后的SSRFD检测器中进行预测,使用MobileNetV3中两个不同卷积层的特征与不同尺寸的锚点相结合的方法进行人脸预测;
步骤四、将SSRFD检测器得到的预测值l=(lcx,lcy,lw,lh)进行解码操作,转化为边界框的真实位置b=(bcx,bcy,bw,bh):
bcx=lcxdw+dcx,bcy=dhlcy+dcy
bw=dwexp(lw),bh=dhexp(lh) (1)
其中,d=(dcx,dcy,dw,dh)表示生成的锚点;
步骤五、采用阈值为0.3的非极大值抑制算法消除重叠检测框;
步骤六、得到最终的人脸检测框,包括人脸置信度、检测框左上角坐标以及右下角坐标信息;
所述步骤三的具体过程为:
将预处理好的图片放入预训练后的SSRFD检测器中进行预测,将MobileNet V3主干网络中提取的第4个卷积层中的特征放入所设计的轻量级特征提高模块,以增强极小型人脸的判别能力,将轻量级特征提高模块的特征和MobileNet V3中第6个卷积层中的特征分别输入到各个预测层进行人脸分类和定位操作;
对于每个锚点,使用相对其坐标的4个偏移量以及N个用于分类的分数进行表示,N=2;在SSRFD检测器训练时,针对于每个锚点,最小化式(2)中所示的多任务损失函数:
其中,Lcls为交叉熵损失函数用于锚点分类,pi为锚点作为人脸的概率,如果锚点为正样本,则否则为0;Lbox采用smoth-L1损失函数用于人脸锚点定位,ti={tx,ty,tw,tn}i为预测框的坐标偏移量,为正样本锚点的坐标偏移量;λ为两项损失函数的权重系数;
所述步骤三中,采用32到512像素的锚点来匹配相应的有效感受野的最小尺寸;轻量级特征提高模块的锚点尺度为32,64,128像素,第6个卷积层的锚点尺寸为256和512像素;该步骤包含锚点密度策略:在该SSRFD检测器中,将锚点尺寸设置为(32,64,128,256,512)5种不同像素,在生成锚点的过程中,当锚点的尺寸为32或64像素时,分别在其锚点位置偏移(0,0.25,0.5,0.75)个像素和(0,0.5)个像素,使其锚点的密度增加4倍或2倍;生成默认的锚点用d=(dcx,dcy,dw,dh)表示。
2.根据权利要求1所述的基于MobileNet V3的实时人脸检测方法,其特征在于,步骤一中,所述的预处理操作包括调整图像大小、标准化。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江南大学,未经江南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910796856.7/1.html,转载请声明来源钻瓜专利网。