[发明专利]抗侧脸干扰的人脸快速检测方法有效
申请号: | 201810194209.4 | 申请日: | 2018-03-09 |
公开(公告)号: | CN108446617B | 公开(公告)日: | 2022-04-22 |
发明(设计)人: | 黄翰;李子龙;郝志峰 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G06V40/16 | 分类号: | G06V40/16;G06V10/764;G06V10/774;G06V10/82;G06N3/04;G06N3/08 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 李斌 |
地址: | 510640 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 抗侧脸 干扰 快速 检测 方法 | ||
1.抗侧脸干扰的人脸快速检测方法,其特征在于,包含数据收集与预处理阶段、预训练与训练阶段和检测阶段,具体步骤如下:
(a)数据收集与预处理阶段,收集实际应用场景下的人脸图像,并对收集到的人脸图像进行标定,生成原始训练集;
(b)数据收集与预处理阶段,对步骤(a)中收集到的人脸图像进行镜像对称、高斯滤波处理,生成综合扩增训练集;
(c)预训练和训练阶段,使用类别数为M的非人脸普通物体的图片作为数据以SoftMaxLoss或log-likehood loss的方式来预训练一个物体检测的多分类模型;
所述步骤(c)包括下述步骤:
(c-1) 使用类别数为20的非人脸普通物体的图片作为预训练数据;
(c-2) 使用ResNet-50对预训练数据集进行训练,并将分类类别从1000类调整为21类,其中20类为上述普通物体,1类为背景;
(c-3) 为了预训练模型能充分的收敛,使用“multistep”的策略进行训练,第一步的步长为200000,第二步的步长为400000,总的迭代次数为800000次;
(d)预训练和训练阶段,将步骤(c)中训练得到的模型参数以迁移学习的方式初始化人脸检测模型的部分参数,并将原始的网络模型改为二分类模型,包括下述步骤:
(d-1)使用步骤(c)中预训练得到的模型,以迁移学习的方式初始化人脸检测模型的部分参数;
(d-2)使用区域全卷积神经网络作为训练的主体框架,并将该框架分类数量修改为2分类;
(e)预训练和训练阶段,将步骤(b)中的得到的扩充训练集作为输入训练集,训练得到检测阶段将要使用的模型,训练采用端到端的方式,包含了候选区域提取、人脸检测特征提取及特征分类的功能,包括下述步骤:
(e-1)使用整张人脸图像作为训练图像,与对应的人脸矩形框坐标一并作为网络的输入;
(e-2)定义网络结构,整个网络包含似然窗口提取子网络和基于区域的全卷积网络;
(e-3)采用端到端的多任务训练方式,使用难例挖掘的方式,训练得到完整的人脸检测模型;
(f)测试阶段该人脸检测方法能够在测试时调节输入图片的缩放尺度;
所述步骤(f)包括下述步骤:
(f-1)在测试时,输入尺度参数,所述尺度参数包含最小缩放边接口和最大缩放边接口;
(f-2)根据输入尺度参数对输入图片自动放缩到合适大小,并进行分类,输出位置信息和类别信息。
2.根据权利要求1所述抗侧脸干扰的人脸快速检测方法,其特征在于,所述步骤(a)包括下述步骤:
(a-1)使用步骤(a)中收集到的人脸图像,使用矩形框对图像中的人脸进行标定,标定时要求矩形框上至额头发际线最高点,下至下巴最低点,左右至脸颊;
(a-2)记录矩形框的左上角点在图像中的位置(x0,y0)与矩形框的宽高(w,h),得出矩形框右下角坐标(x1,y1)其中,x1=x0+w,y1=y0+h。
3.根据权利要求1所述抗侧脸干扰的人脸快速检测方法,其特征在于,所述步骤(b)包括下述步骤:
(b-1)对步骤(a)中进行标定的图片做镜像对称,设原标定框左上角坐标为(x0,y0),右下角坐标(x1,y1),图片宽W,高H;则经过镜像对称后的标定框左上角坐标为(x’0=W-x’0,y’0=y0),右下角坐标(x’1=W-x’1,y’1=y0),得到镜像扩增训练集;
(b-2) 对步骤(b-1)中得到的镜像扩增训练集进行高斯滤波,其中,卷积核大小为9*9,sigma值为5,得到高斯滤波扩增训练集;
(b-3)对步骤(b-1)中得到的镜像扩增训练集和步骤(b-2)中得到的高斯滤波扩增训练集进行整合,整合过程中,人为的进行数据筛选工作:
A.对于存在单张人脸的图片使用多数表决的方式,如果2人认为这为一张人脸图片,则将其保留;否则,将其删除;最终,将所有被保留的图片作为综合扩增训练集;
B.对于存在多张人脸的图片,如果存在被认为是人脸但没有被标记的情况,也将其人为剔除,最终将所有保留的图片作为综合扩增训练集。
4.根据权利要求1所述抗侧脸干扰的人脸快速检测方法,其特征在于,所述步骤(e-2)中,
所述似然窗口提取子网络用于从待测图像中提取出人脸似然区域,具体做法是将最后一个卷积层的每个位置以三种尺度和三种长宽比的组合方式映射回原图像区域,三种尺度面积分别为[128*128,256*256,512*512],三种长宽比分别为[1:1,1:2,2:1],以该种方式映射的图像区域可覆盖原图像的所有目标区域;
所述基于区域的全卷积网络用于判别RPN提供的候选区域是否为人脸并对人脸的位置作进一步调整。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810194209.4/1.html,转载请声明来源钻瓜专利网。