[发明专利]一种基于级联式多尺度的密集人脸检测方法有效
申请号: | 201910326673.9 | 申请日: | 2019-04-23 |
公开(公告)号: | CN110046595B | 公开(公告)日: | 2022-08-09 |
发明(设计)人: | 柯逍;李健平 | 申请(专利权)人: | 福州大学 |
主分类号: | G06V40/16 | 分类号: | G06V40/16;G06V10/764;G06K9/62 |
代理公司: | 福州元创专利商标代理有限公司 35100 | 代理人: | 蔡学俊 |
地址: | 350108 福建省福州市闽*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 级联 尺度 密集 检测 方法 | ||
本发明涉及一种基于级联式多尺度的密集人脸检测方法,分别训练多种尺度范围的检测器,每种物体检测器针对特定的尺度范围,然后将其级联起来,来优化现有的网络结构,这种策略可以搭载在任何人脸检测的深度模型中,具有良好的扩展性,而且对密集小人脸检测更加适用。可以应用于密集人群监测,教室人数统计等具体场景,有着很强的应用价值。
技术领域
本发明涉及深度学习与计算机视觉领域,具体涉及一种基于级联式多尺度的密集小人脸检测方法。
背景技术
深度学习已经在图像分类和物体检测领域中展现了强大的生命力。在最近五年中,自从AlexNet被提出后,在ImageNet数据集的错误率,已经从15%降到2%,已经超于了人类的水平。另一方面,在物体检测领域,最好性能的检测器在COCO数据集也仅仅达到60%的mAp,为什么对于图像分类来说,物体检测相对较难呢?
这是由于物体检测不同于图像分类任务,图像分类的图片尺寸往往是固定的,对于卷积神经网络来说,单一尺度的图像尤其适合卷积核卷积不变的特性,由于训练好的深度模型的权重不变,当图像输入卷积神经网络,根据权重的大小,会产生对应的分类置信度。这是深度学习在图像分类领域中完美的尝试,并且超过了人类的水平,但是与分类任务不同的是,物体检测不光要给出计算出物体的类别,还要给出图像中物体的位置信息,这无疑增大了物体检测的难度,并且,在一张图像里,会存在不同尺度的物体,有些物体只占有很少的像素点,这就进一步增大物体检测的难度。由于物体检测存在着各种各样的困难,并且同一标签的物体尺度范围可能很大,这对卷积神经网络的尺度不变性是一个巨大的挑战,在尺度范围变化较大的数据集中,一个检测器必须适应各种不同尺度的物体。除了尺度范围变化较大的这一问题外,当图像中物体的密集程度过密时,会存在漏检的现象,所以这也是有待解决的问题之一。
发明内容
有鉴于此,本发明的目的在于提供一种基于级联式多尺度的密集人脸检测方法,可以提高探测器准确度,适用于任何目标检测框架。
为实现上述目的,本发明采用如下技术方案:
一种基于级联式多尺度的密集人脸检测方法,包括以下步骤:
步骤S1:采集人脸数据集,并进行预处理,得到预处理后的数据集;
步骤S2:根据预处理后的数据集训练全局检测器;
步骤S3:根据预处理后的数据集,构建局部人脸数据集.并根据得到的局部人脸数据集训练局部检测器;
步骤S5:将全局检测器与局部检测器级联;
步骤S6:将待测图像输入级联后的全局检测器及局部检测器,得到全局检测结果和局部检测结果,并采用非极大值抑制的方法将全局检测结果和局部检测结果结合,得到最终人脸检测结果。
进一步的,所述步骤S1具体为:
步骤S11:收集公开的人脸数据集,并获得相关的图像和标签,并且利用数据增强方式得到扩充的数据集;
步骤S12:采用pascal_voc数据集格式,利用收集到的人脸数据集标签,得到每张人脸图像的xml文件,并将这些xml文件按照pascal_voc格式,将得到的xml文件和图像文件组织在一起,得到预处理后的数据集。
进一步的,所述步骤S2具体为:
步骤S21:将预处理后的数据集,采用VGG16模型基础网络,并且将在Imagenet的预训练的权重加载在现有的VGG模型基础网络上,并在此基础上,训练全局检测器;
步骤S22:全局检测器包含必要的两个部分,特征提取部分和回归分类部分,其中回归分类部分包括分类器和回归器,特征提取部分的数学表达式如公式(1)所示:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于福州大学,未经福州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910326673.9/2.html,转载请声明来源钻瓜专利网。