[发明专利]神经网络训练方法、人脸检测方法及人脸检测装置有效
申请号: | 201711257555.4 | 申请日: | 2017-12-01 |
公开(公告)号: | CN107977628B | 公开(公告)日: | 2020-01-14 |
发明(设计)人: | 袁野;俞刚 | 申请(专利权)人: | 北京旷视科技有限公司;北京迈格威科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/32;G06K9/72;G06N3/04;G06N3/08 |
代理公司: | 11371 北京超凡志成知识产权代理事务所(普通合伙) | 代理人: | 宋南 |
地址: | 100000 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 神经网络 训练 方法 检测 装置 | ||
本发明提供了一种神经网络训练方法、人脸检测方法及人脸检测装置,涉及图像处理技术领域,以缓解现有技术中存在的上下文信息的定义误差较大,影响人脸检测精度的问题,能够结合人脸检测自身特征进行自适应的定义上下文信息,减少了人为先验对上下文定义的偏差,提高了对人脸检测精度。该神经网络训练方法,包括:对人脸图像的特征图进行感兴趣区域处理,获得人脸初步区域;利用神经网络对人脸初步区域进行上下文信息估计,获得人脸上下文区域;通过池化算子对人脸上下文区域的坐标求导,更新人脸上下文区域;根据更新后的人脸上下文区域,对神经网络进行反传损失,更新神经网络的参数。
技术领域
本发明涉及图像处理技术领域,尤其是涉及一种神经网络训练方法、人脸检测方法及人脸检测装置。
背景技术
人脸检测对于多种人脸应用是非常基础并且至关重要的,比如人脸识别,人脸美妆,人脸AR等。其目的在于将图像或视频中人脸区域与其他区域进行区分,进而确定图像或视频中所有人脸的位置、大小、姿态。
在人脸检测的实际应用过程中,由于遮挡,模糊等场景问题,导致人脸检测准确率和检索率降低,因此上下文信息对于此类场景有着至关重要的作用。目前,传统的人脸检测方法通常采用人为指定的启发式方法来获得对应的上下文信息,但该方法具有以下缺点:1、人为先验的依赖性很强;2、不能覆盖所有场景,对于一些偏离先验的场景,处理能力及效果显著下降。上述缺陷导致传统的依赖人为先验的人脸检测方法对上下文信息的定义误差较大,从而影响人脸检测的准确性。
针对上述问题,还未提出有效的解决方案。
发明内容
有鉴于此,本发明的目的在于提供一种神经网络训练方法、人脸检测方法及人脸检测装置,以缓解现有技术中存在的上下文信息的定义误差较大,影响人脸检测精度的问题。
第一方面,本发明实施例提供了一种神经网络训练方法,所述神经网络用于人脸检测;
所述方法包括:
对人脸图像的特征图进行感兴趣区域处理,获得人脸初步区域;
对所述人脸初步区域进行上下文信息估计,获得人脸上下文区域;
通过池化算子对所述人脸上下文区域的坐标求导,更新所述人脸上下文区域;
根据更新后的所述人脸上下文区域,对所述神经网络进行反传损失,更新所述神经网络的参数。
结合第一方面,本发明实施例提供了第一方面的第一种可能的实施方式,其中,所述通过池化算子对所述人脸上下文区域的坐标求导,更新所述人脸上下文区域,具体包括:
利用符号函数对所述人脸上下文区域的坐标求导,更新所述人脸上下文区域。
结合第一方面的第一种可能的实施方式,本发明实施例提供了第一方面的第二种可能的实施方式,其中,所述利用符号函数对所述人脸上下文区域的坐标求导,更新所述人脸上下文区域,具体包括:
所述人脸上下文区域的坐标为
通过以下算式对所述人脸上下文区域的坐标进行求导,更新所述人脸上下文区域的坐标:
其中,F为特征图,u和v分别为特征图的任意一点的横坐标和纵坐标,Frois为人脸上下文区域,u’和v’分别为人脸上下文区域的任意一点的横坐标和纵坐标,x和y分别为人脸上下文区域左上角的横坐标和纵坐标,w和h分别为人脸上下文区域的宽度和长度,w’和h’分别为池化算子的池化区的宽度和长度,κ(·)=max(0,1-|·|)。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京旷视科技有限公司;北京迈格威科技有限公司,未经北京旷视科技有限公司;北京迈格威科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711257555.4/2.html,转载请声明来源钻瓜专利网。