[发明专利]一种基于ShuffleNet改进的MTCNN人脸检测方法在审
申请号: | 202110242262.9 | 申请日: | 2021-03-04 |
公开(公告)号: | CN112949499A | 公开(公告)日: | 2021-06-11 |
发明(设计)人: | 徐成;秦振;刘宏哲;徐冰心;潘卫国;代松银 | 申请(专利权)人: | 北京联合大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06N3/04 |
代理公司: | 北京思海天达知识产权代理有限公司 11203 | 代理人: | 沈波 |
地址: | 100101 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 shufflenet 改进 mtcnn 检测 方法 | ||
1.一种基于ShuffleNet改进的MTCNN人脸检测方法,其特征在于:采用ShuffleNet中的通道混洗方法改进模型,包括以下形成步骤:
步骤一,将图像进行不同尺度的变换,构建图像金字塔;
步骤二,将图像金字塔所有图片输入到P-Net,经过三次卷积,一次池化,两次通道混洗,输出大量Bounding box坐标;
步骤三,根据Bounding box坐标去原图截出图片,resize为24*24;
步骤四,将size为24*24的图片输入R-Net,经过三次常规卷积,两次池化,两次通道混洗,一次逐点组卷积后,输出纠正后更加精确的Bounding box坐标;
步骤五,根据Bounding box坐标去原图截出图片,resize为48*48;
步骤六,将size为24*24的图片输入O-Net,经过四次常规卷积,三次池化,三次通道混洗,一次逐点组卷积后,输出准确的Bounding box坐标。
2.根据权利要求1所述的一种基于ShuffleNet改进的MTCNN人脸检测方法,其特征在于,步骤一中使用了图像金字塔来解决目标多尺度问题,即把原图按照一定的factor,多次缩放得到多尺度的图片。
3.根据权利要求1所述的一种基于ShuffleNet改进的MTCNN人脸检测方法,其特征在于,步骤二中P-NET是一个全卷积网络,卷积、池化、非线性激活都是接受任意尺度矩阵的运算。
4.根据权利要求1所述的一种基于ShuffleNet改进的MTCNN人脸检测方法,其特征在于,步骤二、四、六中进行卷积操作时采用通道混洗思想改进模型,在不同的组里平均分配特征通道,在进行卷积操作时每组的特征都能得到其他组的信息,增强不同通道的特征图之间的关联性。
5.根据权利要求1所述的一种基于ShuffleNet改进的MTCNN人脸检测方法,其特征在于,步骤四、六中进行逐点组卷积;逐点组卷积为组卷积与逐点卷积的组合应用,组卷积的作用是减少参数量,组卷积看成是结构化稀疏。
6.根据权利要求1所述的一种基于ShuffleNet改进的MTCNN人脸检测方法,其特征在于,改进后的MTCNN依然利用三个任务来训练模型,分别是:人脸分类,人脸边界框回归及人脸关键点回归,主要任务是人脸边界框回归。
7.根据权利要求1所述的一种基于ShuffleNet改进的MTCNN人脸检测方法,其特征在于对于每一个候选窗口,预测其与最近的人工标注的边界框的偏移量;学习的目标公式化为一个回归问题,对于每一个样本使用欧式距离来计算损失:
为网络回归输出的值,为人脸实际的标注的位置坐标,包括人脸框左上角在原始图像中的坐标、高度和宽度。
8.根据权利要求1所述的一种基于ShuffleNet改进的MTCNN人脸检测方法,其特征在于多源训练,直接使用一个样本类型指示器实现,整个学习目标函数公式化为;
其中,N为整个训练数据集样本的数量;αj表示学习任务的重要程度,在对网络P-Net和R-Net进行训练时,αj设置为(αdet=1,αbox=0.5,αlandmark=0.5),而训练O-Net时,为了使关键点位置更加精确,αj设置为(αdet=1,αbox=0.5,αlandmark=1);为样本类型指示器;训练网络过程中使用随机梯度下降SGD来优化各阶段的CNN网络参数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京联合大学,未经北京联合大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110242262.9/1.html,转载请声明来源钻瓜专利网。