[发明专利]一种基于尺度估计的人脸检测方法有效
申请号: | 201711294249.8 | 申请日: | 2017-12-08 |
公开(公告)号: | CN107844785B | 公开(公告)日: | 2019-09-24 |
发明(设计)人: | 尚凌辉;王弘玥;张兆生;丁连涛;郑永宏 | 申请(专利权)人: | 浙江捷尚视觉科技股份有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62 |
代理公司: | 杭州奥创知识产权代理有限公司 33272 | 代理人: | 王佳健 |
地址: | 311121 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于尺度估计的人脸检测方法。本发明先使用人脸尺度估计对图像上人脸大小的估计,再根据人脸尺度缩放图像,使用全卷积网络快速做建议框提取,最后做两次级联的分类和回归得到人脸检测结果。本发明使用人脸尺度估计和级联卷积神经网络结合的方法做人脸检测,减少人脸检测整体的计算量,减少人脸检测整体的耗时,并且保证人脸检测的效果。 | ||
搜索关键词: | 一种 基于 尺度 估计 检测 方法 | ||
【主权项】:
1.一种基于尺度估计的人脸检测方法,其特征在于该方法包括以下步骤:离线训练模型和在线检测人脸两部分;其中离线训练模型具体是:步骤1.1、训练人脸尺度估计:步骤1.1.1、将原始图像缩放;步骤1.1.2、根据缩放图像上的人脸宽高的均值计算人脸尺度分数向量;对于一个区间,如果存在属于这个区间尺度的人脸,分数向量上对应的分数置为1,为正样本;如果不存在属于这个区间尺度的人脸,分数向量上对应的分数置为0,为负样本;步骤1.1.3、使用加权的交叉熵损失函数作为训练的损失函数:
其中Loss表示损失,N表示尺度区间数量,n表示尺度区间序号,wn表示第n个尺度区间权重,pn表示第n个尺度区间的分数,
表示第n个尺度区间的估计结果;步骤1.1.4、训练人脸尺度分类器,训练时对图像做水平翻转扰动;步骤1.2、训练Stage1模型;Stage1模型是一个全卷积网络;使用人脸标注数据,生成Stage1模型的训练样本;步骤1.3、训练Stage2模型;使用Stage1模型的结果在原始图片上进行多尺度扫描,分类分数大于阈值的扫描框结果做为Stage2模型的训练样本;步骤1.4、训练Stage3模型;使用Stage1模型和Stage2模型的结果得到Stage3模型的训练样本,Stage3模型的训练样本输入为两张图像块,一张是Stage2模型的回归结果,一张是Stage2模型的回归结果往外扩到其两倍大小的图像块;Stage3训练结果完成后,再对Stage3做难例挖掘,微调模型;在线检测人脸具体是:步骤2.1、输入图像;步骤2.2、人脸的尺度估计:步骤2.2.1、将输入图像缩放,输入训练好的人脸尺度估计模型,得到人脸尺度估计的分数向量;步骤2.2.2、对人脸尺度估计的分数向量做平滑;步骤2.2.3、对人脸尺度估计的分数向量做非极大值抑制,得到人脸尺度;步骤2.3、使用人脸尺度估计结果,对输入图像做缩放,输入Stage1模型,所述的Stage1模型是一个全卷积网络;步骤2.4、将Stage1模型的结果输入Stage2模型,做分类和回归;步骤2.5、将Stage2模型的结果输入Stage3模型,输入为两张图像块,一张是Stage2模型的回归结果,一张是Stage2模型的回归结果往外扩到其两倍大小的框,做分类和回归;步骤2.6、将Stage3模型得到的检测框合并,合并策略使用非极大值抑制;步骤2.7、输出检测结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江捷尚视觉科技股份有限公司,未经浙江捷尚视觉科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201711294249.8/,转载请声明来源钻瓜专利网。