[发明专利]一种基于尺度估计的人脸检测方法有效
申请号: | 201711294249.8 | 申请日: | 2017-12-08 |
公开(公告)号: | CN107844785B | 公开(公告)日: | 2019-09-24 |
发明(设计)人: | 尚凌辉;王弘玥;张兆生;丁连涛;郑永宏 | 申请(专利权)人: | 浙江捷尚视觉科技股份有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62 |
代理公司: | 杭州奥创知识产权代理有限公司 33272 | 代理人: | 王佳健 |
地址: | 311121 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 尺度 估计 检测 方法 | ||
本发明公开了一种基于尺度估计的人脸检测方法。本发明先使用人脸尺度估计对图像上人脸大小的估计,再根据人脸尺度缩放图像,使用全卷积网络快速做建议框提取,最后做两次级联的分类和回归得到人脸检测结果。本发明使用人脸尺度估计和级联卷积神经网络结合的方法做人脸检测,减少人脸检测整体的计算量,减少人脸检测整体的耗时,并且保证人脸检测的效果。
技术领域
本发明属于视频监控技术领域,涉及一种基于尺度估计的人脸检测方法。
背景技术
人脸检测方法的功能是判断图片或者视频中是否有人脸,如果有人脸,预测人脸的位置和大小。人脸检测是对人脸进行各种分析的基础。人脸检测的耗时是它关键的问题之一。大部分情况下,为了减少耗时,不得不牺牲一部分的检测效果。对人脸的尺度估计可以大大减少人脸检测的耗时。
目前已有的技术中,《一种人脸检测方法和装置-201510639824.8》使用AdaBoost的方法,在快速多尺度金字塔特征数据提取的基础上进行分类,在保障检测准确度的前提下能够有效降低计算量,但是AdaBoost的方法不能有效使用当前大量的训练数据提升检测次性能。《人脸检测的方法及装置-201610206093.2》使用AdaBoost提取建议框再用卷积神经网络做人脸检测,此方法第一步的建议框提取的阈值选择在不同的场景下需要调整,比较繁琐。《人脸检测的方法及装置-201710618497.7》使用级联的卷积神经网络做人脸检测,因为整体计算量大,耗时问题比较严重。
发明内容
本发明针对现有技术的不足,提供了一种基于尺度估计的人脸检测方法。
本发明先使用人脸尺度估计对图像上人脸大小的估计,再根据人脸尺度缩放图像,使用全卷积网络快速做建议框提取,最后做两次级联的分类和回归得到人脸检测结果。
本发明方法主要包括以下步骤:
步骤一、离线训练
1.1、训练人脸尺度估计
人脸尺度估计将尺度空间划分成多个区间。对每个区间做判断,输入图像上是否存在属于这个区间的人脸。简单来说,人脸尺度估计就是做多个二分类,得到对多个区间是否存在这个尺度人脸的分数向量。
1.1.1、将原始图像缩放;
1.1.2、根据缩放图像上的人脸宽高的均值计算人脸尺度分数向量。对于一个区间,如果存在属于这个区间尺度的人脸,分数向量上对应的分数置为1,为正样本;如果不存在属于这个区间尺度的人脸,分数向量上对应的分数置为0,为负样本。
1.1.3、训练的损失函数使用加权的交叉熵损失函数:
Loss表示损失。N表示尺度区间数量。n表示尺度区间序号。wn表示第n个尺度区间权重。pn表示第n个尺度区间的分数。pn表示第n个尺度区间的分数。表示第n个尺度区间的估计结果。
进一步,当需要做精细准确的尺度估计的时候,需要更密得划分尺度区间,即N会变得很大。但是正样本数量是基本不变的,这会造成正负样本不均,训练难以收敛。对正样本加一个比负样本更大的权重可以有利于训练收敛。标注数据生成的人脸尺度分数向量方差很大,为了缓解这个问题,将正样本附近的负样本权重置为0。
1.1.4、训练人脸尺度分类器,训练时对图像做水平翻转扰动。
1.2、训练Stage1模型。Stage1模型是一个多任务模型,任务是分类和回归。分类任务分类图片块是不是人脸,回归任务回归人脸包围盒左上和右下两个点的位置。使用人脸标注数据,生成Stage1模型的训练样本。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江捷尚视觉科技股份有限公司,未经浙江捷尚视觉科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711294249.8/2.html,转载请声明来源钻瓜专利网。