[发明专利]人脸定位方法和装置在审
申请号: | 201610848554.6 | 申请日: | 2016-09-23 |
公开(公告)号: | CN107871099A | 公开(公告)日: | 2018-04-03 |
发明(设计)人: | 程海敬;芦姗;孔令美;张祥德 | 申请(专利权)人: | 北京眼神科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62 |
代理公司: | 北京康信知识产权代理有限责任公司11240 | 代理人: | 韩建伟,张永明 |
地址: | 100085 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 定位 方法 装置 | ||
技术领域
本发明涉及人脸定位领域,具体而言,涉及一种人脸定位方法和装置。
背景技术
现有技术中,人脸识别技术的应用越来越广泛,但是,在现有的人脸识别方案中关键的步骤为人脸定位技术,其中,人脸定位技术主要是对多个特征点进行定位,即在人脸检测的基础上自动定位出人脸关键点,例如,眼睛、鼻子、嘴巴、轮廓等特征点。特征点定位在识别系统中扮演着一个很重要的角色,它是识别正确与否的关键。
因此,所以为了得到识别率高、鲁棒性好的识别系统,研究特征点定位是非常重要的。人脸特征点定位的研究意义不仅仅局限于人脸识别,还可以将其定位结果应用于其他方向,比如现在很火的美图秀秀、自动人脸识别、表情识别以及人脸动画自动合成等。
现有技术中,最初的人脸定位算法都是基于局部分类器的滑动窗口搜索方法,这种方法将面部特征描述成高维空间中的一个点,用大量的样本进行训练,构造出能够区分两类样本的分类器,然后用分类器得到每一个关键点坐标;或者基于点分布模型的方法,比如,ASM(Active Shape Model)和AAM(Active Appearance Model)方法等。
近些年来,人脸定位技术的研究取得了飞速的进展,有部分新的人脸定位算法被提出,目前,使用的最多的是级联形状回归模型和基于深度学习的方法。
级联形状回归模型就是使用回归模型,直接学习从人脸特征到人脸形状的映射函数,进而,建立从表观到形状的对应关系。现有很多基于回归的方法中,比较突出的有DCR方法(Deep Cascaded Regression)、ESR(Explicitly Shape Regression)方法、LBF(Local Binary Features)方法以及SDM(Supervised Decent Method)方法。上述回归函数的学习依赖于预先选取的训练集,如果训练集中包含了复杂的变化,学习到的函数测试性能就会比较好。
但是,上述方法也存在一定的问题,例如,滑动窗口搜索方法是基于局部图像特征的,而局部特征很容易产生歧义点,因此,这类方法很难找到具有全局信息的关键点。基于点分布模型的方法和基于形状回归的方法都很依赖于初始值,其中,初始值通常由训练集的平均形状来给定,如果初始值或者设定的平均形状远远偏离目标位置,很难收敛到正确位置。比如,训练集中大部分都是正脸,那么对于测试集中大偏转角度人脸图像的定位就比较困难。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种人脸定位方法和装置,以至少解决现有的人脸定位技术中定位精确度较差的技术问题。
根据本发明实施例的一个方面,提供了一种人脸定位方法,包括:获取待训练样本,其中,所述待训练样本包含至少一个待训练图像,并且所述至少一个待训练图像中包含待训练的人脸图像;使用所述待训练样本训练深度单卷积神经网络模型的目标参数的参数值,得到训练之后的所述深度单卷积神经网络模型;通过训练之后的所述深度单卷积神经网络模型对待测试图像中包含的人脸图像的特征点进行定位,输出定位结果,其中,所述深度单卷积神经网络模型由依次连接的多个网络层构成,所述多个网络层用于对所述待训练样本或所述待测试图像进行单次数据处理,所述多个网络层包括:至少一个卷积层,至少一个最大池化层,至少一个全连接层。
进一步地,所述深度单卷积神经网络模型的所述多个网络层依次由4个卷积层、4个最大池化层、2个全连接层构成。
进一步地,所述深度单卷积神经网络模型的所述多个网络层依次由第一卷积层、第一最大池化层、第二卷积层、第二最大池化层、第三卷积层、第三最大池化层、第四卷积层、第四最大池化层、第一全连接层、第二全连接层构成。
进一步地,所述第一卷积层的卷积核为7*7的卷积核,并且所述第一卷积层的步长为1;所述第二卷积层、所述第三卷积层和所述第四卷积层的卷积核均为3*3的卷积核,并且所述第二卷积层、所述第三卷积层和所述第四卷积层的步长均为1。
进一步地,获取待训练样本包括:在原始待训练图像中生成人脸检测框,其中,所述人脸检测框中包含所述原始待训练图像中的人脸图像;以所述人脸检测框的中心为旋转中心,按照预设角度旋转所述原始待训练图像,其中,所述预设角度至少为一个;截取旋转之后处于所述人脸检测框中的第一人脸图像,并将截取到的所述第一人脸图像作为所述多个待训练样本。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京眼神科技有限公司,未经北京眼神科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610848554.6/2.html,转载请声明来源钻瓜专利网。